AIGC在审计领域的运用

作者简介:
易冰心,刘思琦,王志勇,北京物资学院会计学院,立信会计师事务所北京分所

原文出处:
中国注册会计师

内容提要:

02


期刊代号:V3
分类名称:审计文摘
复印期号:2024 年 02 期

关 键 词:

字号:

      AIGC(AI-Generated Context)是通过人工智能技术自动生成内容的一种技术,无论在文本、图片,还是音频、视频方面都能以其流畅的对话、连贯的逻辑、精准的输出,扮演着无所不知的百科全书的角色。同时,还能撰写具有特定内容和语气的电子邮件,编辑文本结构和措辞,用多种编程语言生成计算机代码等(Salvagno等,2023;Street和Wilck,2023)。在人工智能时代,AIGC这类生成式人工智能技术能够将人类从重复的脑力劳动中解放出来,因而可能以前所未有的方式颠覆商业世界和社会(Mich和Garigliano,2023)。在审计业务执行工作中,会涉及到海量结构化和非结构化数据,要从这些纷繁冗杂的数据中识别和判断风险点并发现重大错报,而AIGC技术的优势正在于高效处理数据,让计算机像人一样学习知识,并利用学到的知识解决问题,其具备的颠覆性能力和令人期待的前景受到审计行业的密切关注。本文通过分析AIGC技术的基本原理和特点,结合相关文献,探索AIGC对审计领域运用的可行性和可能存在的问题,提出应对措施和展望。

      一、AIGC的技术原理和特点

      AIGC技术基于人工智能的自然语言处理方法,旨在理解和生成与特定上下文相关的文本,在对话系统、推荐系统、文本挖掘等领域具有广泛的应用潜力。AIGC利用先进的机器学习模型,如循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)以及Transformer架构,捕捉文本中的复杂关系和语义信息。同时,AIGC将大量文本信息灌入模型中,使其能够学习自然语言处理的规律并进行预测,以便在给定上下文的情况下更准确地生成文本。这种方法类比于人类大脑体积的增长和智商的提升过程。当人类大脑得到更多的输入和刺激时,能够更快地学习和进化,从而提高智力水平。AIGC同样是如此,尽管它并无意识,但它在大量语料库和数据集的支持下,在众多不同场景下生成合适内容的能力正在飞速提高,以至于能够完成一些传统认为必须通过人脑才能处理的工作,这类工作不仅是体力劳动的范畴,还有可能在创造性劳动范畴之类。

      在AIGC技术中最著名的应用是ChatGPT。ChatGPT是美国人工智能研究实验室Open AI新推出的一种人工智能技术驱动的自然语言处理工具,其独特之处在于采用了AIGC技术,并使用大量维基百科、新闻报道、社交媒体、科研论文等文本数据,采用大规模预训练语言模型GPT(Generative Pre-trained Transformer)进行深度处理,使模型能够更好地理解和生成自然语言。这使得用户与ChatGPT进行对话时,模型能够根据用户输入的信息进行分析和理解,还能根据聊天的上下文进行互动,然后生成自然流畅并具有个性化的回复,做到与真正人类几乎无异的聊天场景。同时,ChatGPT不仅仅是聊天机器人,还能完成撰写邮件、文案、视频脚本、翻译、代码论文等各种任务。结合对ChatGPT-4系统的使用体验,笔者归纳了AIGC技术的优势与存在的问题。

      AIGC表现出以下突出优势:

      1.极强的文本理解能力。AIGC可以理解问题的语义含义,理解句子中的复杂结构、隐含信息和上下文含义,而不仅仅是字面意思。同时,它能够识别一些情感和语气相关的词汇、短语和表达方式。因此,AIGC可以处理文本中逻辑和情感等复杂信息,从而很好地理解用户问题和需求。

      2.强大的文本生成能力。AIGC生成的文本通常具有流畅的语言表达和逻辑性,且具有一定的创造性,能够生成一些新颖的、非常规的回复,在长距离生成过程中不会有重复、不通顺、机械等传统生成模型固有的问题。

      3.善于进行知识的检索与整合。AIGC可以根据用户的问题和上下文信息,检索数据集中的相关知识,并将其整合到回复中,因而可以提供更全面、准确、相关的问题回复。

      4.基于自然语言的人机交互方式,能够高效解决复杂问题。用户能够像与人类进行对话一样与AIGC进行交流,AIGC会根据用户输入和历史对话生成相应的回复。人机交互方式能够实现实时响应,用户提出问题后,AIGC立即生成回复,无须等待和排队,大大提高了问题解决的效率。

      5.可扩展性强。一方面,AIGC可以通过添加新的训练数据来扩展其知识库,还可以通过预训练模型和微调的方式进行迁移学习,使其在不同领域的任务中表现更好。另一方面,开发团队能够提供API(Application Programming Interface,指应用程序编程接口),以让开发者在其应用程序中使用AIGC,从而使得AIGC能够结合各种工具,获得更广泛的应用场景。

      AIGC目前存在以下问题和隐患:

      1.“幻觉”问题。即模型在生成回答时可能会产生虚假或不准确的信息,给用户留下错误的印象或误导。这可能是由于模型在训练数据中存在的偏见、误导性或不准确的信息所致,模型在回答问题时可能会无意中重复、扩大或加剧这些问题。OpenAI团队也在其公司博客中提醒大家,ChatGPT有时会给出看似合理实则错误或无意义的回答。

      2.数据安全问题。AIGC的工作是基于大量互联网数据的收集与分析,随着语料库的不断扩展,越来越多的用户数据与信息可能被纳入其中,这个过程存在数据泄露的风险。例如,ChatGPT使用过程存在严重的敏感信息泄露问题,数据安全公司Cyberheaven的研究人员分析了不同行业客户的ChatGPT使用情况,发现自ChatGPT公开发布以来,5.6%的知识工作者在工作中至少尝试使用过一次,4.9%的员工向ChatGPT提供了企业数据,其中2.3%的员工将公司机密数据贴入ChatGPT。

相关文章: