ChatGPT是人工智能技术最新发展的典范之作。ChatGPT是由美国OpenAI科技公司于2022年11月推出的聊天机器人程序,它凭借巨大的语料数据库和强化学习训练(Reward Learning for Human Feedback,RLHF),大大提升了人工智能水平。ChatGPT允许用户以自然语言提问,并且具备信息检索、聊天对话、内容生产等多种功能。ChatGPT的出现有望加速写作助手、对谈系统、智能客服、代码开发等领域的商业化进程。ChatGPT可以回答的内容并不局限于常识,还包括商业问题的组合式解决方案。毋庸置疑,ChatGPT的技术发展与应用将改变我们的世界,这让我们深思未来ChatGPT服务人类的方式和领域,以及ChatGPT作为算法模型对税务领域的影响及实践应用空间。 一、ChatGPT的技术框架与应用逻辑 (一)ChatGPT的技术形成框架 ChatGPT本质是一个运用AI驱动的高级自然语言处理工具,它能学习并理解人类语言,可以像人类一样聊天、交流、互动。但ChatGPT又不能简单地理解为聊天机器人,它有着智能客服、文本与语音生成、数据分析与决策支持等多种应用技能。ChatGPT的技术实现过程包括收集大量高质量的数据集、预训练以及强化学习三方面,形成符合人类交流习惯的大型语料库,并在此语料库基础上,使用Transformer神经网络模型来构建ChatGPT自身的语言模型,用以处理问题输入及回答输出。 1.数据库。虽然OpenAI至今没有公开披露ChatGPT依赖的数据集,但据人工智能领域专家研究,ChatGPT模型的数据集可分为以下六类:维基百科、书籍、期刊、Reddit链接、Common Crawl和其他数据集,这大大超出了传统人工智能的数据库范围。更大的训练数据集意味着模型拥有更大的参数规模,允许模型捕获更复杂的语言模式和关系,从而提高复杂自然语言处理任务的准确性。 2.预训练。数据库预训练环节需要人工干预。首先需要人工把语料分割成许多独立的语句或段落,再对每个语句进行分词。分词后再把每个单词转换成数字,生成一个数字序列,最后构成数字词典。 3.强化学习。OpenAI为打造ChatGPT而建立的强化学习算法训练奖励模型可以分为三个阶段:第一阶段是收集示范数据,即在数据集当中随机抽取问题,由人类标注员给出对应答案,基于监督学习(Supervised Learning)使用这些问题和答案对模型进行微调。在这一过程中人工智能培训师着重建立监督机制。第二阶段是收集比较数据,即告诉ChatGPT什么答案是好的答案,从而训练一个奖励模型。第三阶段是利用强化学习算法,通过不断优化和迭代而形成庞大的语料库,供ChatGPT回答使用。 (二)ChatGPT的技术特征与应用优势 ChatGPT与以往人工智能机器人具有不同的技术形成过程,使其具有应用上的独特优势:人工标注能够使ChatGPT围绕人类感兴趣的问题编写答案,能够根据用户的实际环境、聊天技巧和需求来完成精准推荐,使得答案在用户看来更加直观;强化学习有别于监督学习,给予模型更大的探索自由,使ChatGPT可以回答的问题包罗万象。ChatGPT的出现大大推进了生成式人工智能(Artificial Intelligence Generative Content,AIGC)和自然语言处理(Natural Language Processing,NLP)领域的研究进展(王国成,2023)。由此可见,ChatGPT的开发目的并不是要提供一个虚拟聊天工具,而是通过提供智能对话系统,帮助用户获取各种类型的信息,提供各种工具、服务以及解决问题的方案,使用户的生活更加便捷和高效(李书宁和刘一鸣,2023)。具体而言,ChatGPT拥有高质量人机对话、人机协同、高度智能的技术特征和应用优势。 1.高质量对话。高质量的人机对话是ChatGPT的核心特征。ChatGPT整合了任务导向与闲聊等不同功能,它既可以完成人类下达的指令,又可以给人类提供情感上的回应和支持。ChatGPT背后的奖励模型(Reward Model,RM)和人类反馈指导(Instruct)模型使其能回答出更贴近人类思维的新内容,与传统的搜索引擎仅响应单个问题,并一次性给出多个答案让用户自己选择的服务模式不同,ChatGPT能根据聊天的上下文,精确地捕捉人类每一次问话的意图,并基于预先训练的海量语料库,用文本形式智能地生成一个符合人类习惯的答案。 2.人机协同。ChatGPT可以实现连续性的人机协同,用户可以在个人账号中保存人机对话记录,并基于该记录达成长期连续性对话,从而提升人机协同的效能。 3.高度智能。高度智能体现为ChatGPT具有高度伦理性、纠错机制和多模态对话的特征。首先,ChatGPT的程序设计者最初就极力规避算法歧视、偏见或侮辱、暴力及血腥倾向的内容,使其应用具有较高的道德伦理及法律底线。其次,ChatGPT虽然与人类的心智相距甚远,但会主动承认自身的回答错误并随即优化答案(刘勤,2023)。ChatGPT甚至还会质疑用户所提问题的正确性,敏锐地捕捉用户的想法。最后,随着GPT-4的更新,多模态技术(Multi Modal Machine Learning,MMML)的引入实现了多感官交流功能,人类可以使用视觉输入(图片、视频)、听觉输入(音频)、触觉输入(压力)与之展开会话,将人类的各种请求转换为可执行的任务。