2023年以来,以ChatGPT为代表的“生成式人工智能”(Generative Artificial Intelligence)成为全球瞩目的科技热点。它不仅影响着人类的生产和生活方式,而且为各行各业的创新和发展提供了新的思路和工具。作为新一代人工智能技术,生成式人工智能能够通过学习大规模数据,模拟人类的创造性思维,生成全新、真实、原创内容。生成式人工智能的广泛应用,正在不断颠覆被审计单位的数据应用原理,并对审计人员在审计过程中应用人工智能生成的数据带来巨大挑战。但不可否认的是,审计人员利用人工智能进行审计可以大幅提高审计质量和效率。 生成式人工智能颠覆数据应用原理 近年来,生成式人工智能成为人工智能领域最令人瞩目的突破之一。这种新型人工智能技术通过学习现有的海量数据,掌握数据中的模式和规律,并生成全新的数据,正在改变人们对人工智能的认知。事实上,生成式人工智能已经跨越了重大鸿沟,从理论概念迅速转变为具有广泛应用的实用工具,在教育、金融、会计、审计等多个行业引发颠覆性革命。 (一)生成式人工智能改变数据生成方式 生成式人工智能技术的广泛应用和不断发展,正在逐渐改变人们对于数据的理解和应用原理。 1.发现数据规律。在没有人为干预的情况下,生成式人工智能可以通过学习大量无标签的数据,发现数据的内在结构和规律。这种无监督学习方法可以更好地使人们理解数据的结构和规律,极大地降低人力成本,提高数据的质量和利用效率。 2.生成模拟数据。生成式人工智能可以通过学习现有的数据,模拟数据中的结构和规律,生成大量的模拟数据,帮助人们解决数据稀缺的问题。在医疗、金融、审计等领域,有时获取大量高质量的数据较为困难,而生成式人工智能可以根据已有的数据,生成与真实数据相似的模拟数据,提高人们对事物的认识。 3.揭示数据特征。生成式人工智能可以通过对现有海量数据的系统学习,自动揭示出数据中的隐含特征和一般规律。这可以帮助人们更好地理解数据的本质特征,加深对数据结构的深层次了解,进而进行更准确、更全面系统的数据分析和预测。 (二)生成式人工智能改变数据生成规律 1.生成全新数据。生成式人工智能具有强大的灵活性,能够处理各种形式的数据,并非只是对现有数据进行简单模仿或分类,而是能生成全新的数据,包括文本、图像、音视频等。这种生成过程并非简单地复制或拼凑,而是基于深度学习算法的创造性组合而生成的全新数据。 2.数据推理和决策。生成式人工智能面对新情况、新问题时,能够通过对现有数据的推理和决策,寻找到更合适的解决方案。这种能力使得生成式人工智能在各行各业和众多领域具有广泛的应用前景,如医疗诊断、金融分析、审计方案选择等。 3.挖掘数据新原理。数据生成是指利用生成式人工智能算法从现有数据中提取数据,并生成新的原始数据。生成式人工智能不仅能“生成数据”,而且能挖掘、总结生成数据的新原理。这种挖掘、总结生成数据的新原理,使得生成式人工智能处理复杂数据时更具灵活性和可选择性。 (三)生成式人工智能颠覆数据库的结构 1.向量嵌入。过去,数据库数据的存储为行,每个数据位于单独的列中。现在,生成式人工智能形成的数据库支持纯向量,将数据存储为长数据向量,因此无需将数据分解为行和列。向量嵌入是一种将复杂数据转换为单个数字列表的模式,当嵌入设计良好时,数据库可以提供快速访问和复杂查询。 2.便于查询。向数据库添加向量带来的不仅仅是便利,而且新的查询函数可以搜索与之完全匹配的数据,甚至可以定位“最接近”的值,有助于实现推荐引擎或异常检测等功能。新的基于向量的数据库查询系统比人们想象的更加“神奇”,新查询将查找与之匹配的数据,新的生成式人工智能数据库有时感觉更像是在阅读数据库的思想。 (四)生成式人工智能创新数据分析方式 1.解决数据不足难题。在数据分析中,经常会遇到数据缺失、数据质量不高、数据量不足等问题,而生成式人工智能技术可以根据已有的数据,通过模拟和推断,生成全新的、真实的数据,从而解决上述难题。 2.提高数据分析精度。在数据分析中,往往会因为数据的偏差、噪声等问题,导致数据分析结果的误差较大。而生成式人工智能技术可以通过对数据的深入学习和理解,去除噪声和偏差,提高数据分析的准确度。 3.提高数据分析效率。在数据分析中,数据采集、处理、清洗等环节都需要耗费大量的时间和人力成本。而生成式人工智能技术可以通过自动化生成数据,降低数据的采集和处理成本,同时也可以提高数据分析的效率。 审计人工智能生成数据的实现路径 生成式人工智能技术颠覆了数据应用原理,这不仅会给审计工作带来新的挑战,同时也会带来新的机遇。生成式人工智能可以模拟人的创造性思维,生成全新的、真实的、有用的数据。然而,生成式人工智能技术也存在诸如数据质量和安全、模型效率和稳定性、数据真实性和合法性等问题,因此需要通过确定审计内容、选择审计技术方法等加以解决。审计本质上是对数据审计并发表审计意见、出具审计报告,审计人员需要深入研究生成式人工智能生成的大量数据,发掘更多的应用潜力,同时也要注意解决其存在的问题和挑战,研究审计生成式人工智能生成数据的实现路径,为数据审计的发展和应用创造更好的环境和条件。