ChatGPT的智能性及其在财税领域的应用

作 者:

作者简介:
蔡昌,中央财经大学财政税务学院教授、博士生导师,税收筹划与法律研究中心主任,北京 100081;庞思诚,中央财经大学财政税务学院,北京100081。

原文出处:
商业会计

内容提要:

02


期刊代号:F1011
分类名称:财务与会计导刊(实务版)
复印期号:2023 年 08 期

关 键 词:

字号:

       2022年11月30日,人工智能研究实验室(Open AI)推出了全新的人工智能对话聊天机器人ChatGPT,在全世界产生了巨大的轰动效应。至2023年1月底,仅两个月时间,ChatGPT的活跃用户就已经超越1亿户,成为有史以来用户数增速最快的应用程序模型,世界诸多大企业和科研机构纷纷进军人工智能产业,如微软的BingChat、谷歌的 Bard、百度的文心一言、复旦大学自然语言处理实验室的MOSS等。

       之所以ChatGPT能引起广泛的关注,不仅是因为ChatGPT能够顺利实现人类与人工智能机器人无障碍的交流,还因为其具有强大的知识整合能力,并能简单直接地反馈任务、实现结果。ChatGPT的出现,弥补了人类认知、能力和精力的有限性,通过与大数据、区块链等新兴技术的结合,对各个领域发展产生积极的推动作用,引起社会各界的广泛关注。具体到财税领域,ChatGPT能解决征税人、纳税人和中介机构三类主体的不同需求,本文对其解决途径进行了探讨。

       一、ChatGPT的智能性及其实现模式

       (一)ChatGPT是什么

       ChatGPT(Chat Generative Pre-trained Transformer)是人工智能技术驱动的自然语言处理模型(LLM),它能够通过理解和学习人类的语言真正像人类一样与人类用户聊天交流,甚至能完成撰写文章、文案和从事翻译、编写代码等任务。ChatGPT是预先训练的大型语言模型,本质上是一种生成式人工智能技术。 ChatGPT的核心技术是InstructGPT,如图1所示。ChatGPT通过基于人类反馈的强化学习,让人工智能模型产生类似人类一样的常识、认知、需求和价值观。

       从技术根源来说,ChatGPT是 GPT(Generative PreTraining)的一种典型模式,其最大的特点是可以通过已知的信息来预测将要填写的内容。

      

       图1 ChatGPT的核心技术

       2016年Open AI发布了GPT-1,虽然该模型采用了具有创新意义的 GPT方式进行底层逻辑构建,但该模型仍然具有传统人工智能模型的缺点:需要根据任务的不同进行调整,通过再训练才能执行任务。2019年Open AI公司发布了GPT-2,该模型除了拥有更大的参数和训练样本量之外,更重要的创新就是采用“零样本设置”(Zero-shot Setting),在模型的训练中加入暗示,使GPT-2模型可以在不用微调的情况下直接使用。2020年Open AI公司又发布了GPT-3,该模型拥有海量的参数和训练样本.还采用“零样本设置”(Zero-shot Setting)、“单样本设置”(One-shot Setting)和“多样本设置”(Few-shot setting),使模型能够更精准地预测下游任务。基本可以根据人类指示比较好地完成任务。但是,GPT-3还存在一定的缺陷,即无法实现类似人类语言的文本输出。因为GPT-3模型所含有的参数较大,存在多方面过度输出的问题,可能会产生答非所问的结果,并且GPT-3的训练数据不够纯净,导致GPT-3带有一定的偏见性。为了克服上述缺点。Open AI公司又对GPT-3的语言学习方面进行了升级,基本克服答非所问和偏见性回答的问题,目前已升级到GPT-4。

       (二)ChatGPT的实现模式

       就具体过程而言,ChatGPT实现模式具有相互关联又层层递进的运行机制,具体分为以下三步,如图2所示。

       第一步,收集示范性数据并采取受监督的方式训练。想要人工智能以人的方式来回答问题,那么必须人类自己先回答问题,再将回答作为参考供人工智能学习。随机从提示词(Prompt)数据集中选择要提问的问题,然后标注人员(Labeler)对问题进行解答,形成人类偏好的标注数据供机器学习使用。数据量无须太大,只要几万条,通过提示词的方式进行训练,使模型参数不断发生变化。在训练过程中必须采取人工监督的方式,通过人工奖励和惩罚机制,奖励符合人类逻辑的回答,惩罚不符合人类逻辑或者不合法的回答,以修正模型的输出结果。

       第二步,收集可比数据并训练一个奖励模型。用一个提示词对模型进行提问,然后让模型输出多个不同的回答。标注人员对这些输出结果进行打分并排序,挑出最好的和最差的解答,并将这些数据用于训练奖励模型。在此期间,针对不合法、不合理、不理解的回答,奖励模型会对其进行惩罚,并剔除出模型回答范围。相反,对于接受度高的回答给予奖励,使回答频率更高。

       第三步,使用强化学习算法优化奖励模型。通过强化学习算法,不需要人工主动干预就能自动实现对输出结果的评分和排序,并以此优化模型。人工智能通过循环式学习、优化模型、修改输出结果,实现不断迭代升级,最终达到人工智能具有人的逻辑,从而能够以人的方式进行沟通,并且做出令人满意的行为结果。

       (三)ChatGPT的智能性分析

       本文对ChatGPT的智能性及独特优势进行系统分析。

       1.ChatGPT具有强大的语言能力。语言是沟通的挑梁,只有双方都能理解各自表达的含义,才能顺利完成合作。ChatGPT是一种具有优秀语言能力的人工智能模型,它能理解人类所表达内容的含义,并完成任务,再以一种人类可以理解的方式将结果输出,这为它应用于财税领域奠定了基础,使财税人员和人工智能之间能够互相知晓任务的内容和要求,并在任务完成时提交理性的输出结果。它还可以更换不同的表达方式让不同类型的人更好地理解它所表达内容的意思,这是它优于其他人工智能技术的重要体现。比如针对外行人,通过“简单表述”这个提示词,它回答的内容会尽可能浅显易懂;针对专业人士,通过“详细表述”这个提示词,其回答会更专业、详细、全面。

       2.ChatGPT拥有全面的处理能力。ChatGPT采用海量的数据进行训练,并且这些数据涉及各行各业,使ChatGPT具备更全面的能力和性能,比如翻译、撰写文章和编程等。过去的人工智能仅能在单一领域具有超常的作用,深蓝、阿尔法狗等人工智能产品在计算、围棋等领域取得显著成果,而ChatGPT能在不进行强化训练的情况下,参加美国医学执照考试(USMLE)并获得美国医疗许可证。

相关文章: