美国注册反欺诈审查师协会(Association of Certified Fraud Examiners,ACFE)与世界著名的统计分析软件提供商SAS(Statistical analysis system,SAS)2020年联合开展的一项跨行业全球调查显示,约有25%的组织有意向在未来两年内应用人工智能(Artificial Intelligence,AI)和机器学习(Machine learning,ML)来侦测欺诈行为,意味着AI和机器学习必将成为未来反欺诈解决方案的技术发展方向。机器学习是人工智能的一个重要子集,其基本思想是尝试训练机器,以便使其能够采取类似于人类学习的方式从大量复杂数据中进行学习,并能够预测未来。随着互联网、移动通讯、5G技术的兴起以及计算机处理速度和数据存储能力的提升,机器学习系统已普遍应用于图像识别、语音识别、产品、服务和内容的精准配对与推送、客户流失预测、信用卡欺诈监测和供应商风险管理等相关领域。例如,从网络搜索引擎到社群网络的内容过滤,从电子商务平台精准的目标广告推荐到抖音平台同类型视频内容的精准推送等,这些均是机器学习重要的商业应用。 机器学习未来有可能对所有行业产生颠覆性影响,会计和审计也不例外。机器学习将会极大提升会计工作的效率和效果,会计循环的多个步骤均可以实现自动化,尤其是当源文件不是结构化和机器可读的格式而需要人工处理时(例如手写或扫描图像),机器学习的优越性将进一步凸显。而且,应用机器学习的语音识别功能,当聊天机器人与客户交谈的同时,可以自动下订单,生成销售发票,并将数据传输到公司的会计信息系统。此外,某些传统的会计程序也可能会变得过时。例如,对库存的实物清点或对基础设施或其他资产的检查,可以由配备视觉识别系统的无人机自动完成。在机器学习的赋能下,该系统可以识别物体,检查质量和状况,测量一些关键的参数。通过这种方法,诸如“先进先出”和“后进先出”等库存管理方法可以低成本地运行和改进。 机器学习也已经成功应用于审计领域的多项任务中,如审查源文件、分析业务交易和事项、评估风险等。学者们还探讨了利用机器学习来预测欺诈(Bao et al.,2020)、破产(Gentrym et al.,2002)、重大错报(E.Hunt,et al.,2020)和会计估计(Ding等,2020)。德勤首席创新官乔恩-拉斐尔(Jon Raphael)预计,机器学习将大大改变审计的方式,因为它能让审计人员在很大程度上“避免在速度和质量之间进行权衡”。机器学习算法不再主要依靠重复性抽样技术,而是可以审查公司的整体数据,审计人员能够以更加全域的视角来组织实施更有针对性的测试,及时辨识公司整体的异常情况。此外,机器学习算法可以从审计人员对具体项目的结论中“学习”,并将同样的逻辑应用于具有类似特征的其他项目。更为重要的是,长期以来,在实证研究演绎推理的范式下,归纳推理方法在会计和审计的主流研究中被低估,机器学习正在引起人们对归纳推理方法的重新认识,而且机器学习也是演绎推理类研究方案常选的技术方法和工具。例如,Li(2010)使用了一种贝叶斯机器学习算法,挖掘分析财务报告中管理层讨论和分析部分(Management discussion and analysis,MD&A)隐含的预测性、前瞻性信息内容。Brown、Crowley和Elliott(2020)使用机器学习技术,评估财务报表披露的主题内容在预测故意误报方面是否具有增量信息。基于算法和技术的视角,机器学习通过提供可靠的审计证据和促进决策机制改善,有助于提升审计效率和审计质量(Hsieh,et al.,2020;Zhang,Cho和Vasarhelyi,2020)。然而,机器学习的实践应用也引发了人们对其潜在偏见和道德影响的关注,如何消除机器学习可能产生的偏见,治理机器学习可能产生的伦理风险,开展负责任的人工智能研究也是值得关注的研究议题。 本文在系统诠释机器学习本质内涵的基础上,剖析了机器学习引发的由演绎推理向归纳分析的研究范式转变,分析了机器学习在模式识别、自然语言处理、视觉信息和决策等多个领域的应用发展,总结梳理了机器学习模型审计应用的模式、面向审计全生命周期的机器学习模型系统应用以及国际“四大”机器学习系统的应用实践,围绕机器学习模型可能产生的偏见和伦理风险,辨析了机器学习模型审计应用所产生偏见的类型与潜在的风险和影响,并提出了相应的应对策略,以便更好地发挥机器学习的整体效能。 二、机器学习的内涵及其新发展 (一)机器学习的内涵界定 Arthur Samuel(1959)创造性地提出“机器学习”这个概念,将其界定为“一个研究领域,它赋予计算机不需要明确编程就能学习的能力”。Mitchell(1997)为机器学习提供了一个供广泛参考的定义:“机器学习领域关注的是如何构建能随着经验自动改进的计算机程序的问题”。两者都坚持类似的观点,即机器学习的目的是使计算机自动(而不是由人类明确编程)从历史数据中学习模式和趋势,并且迭代改进其学习性能,可通过其预测精度来衡量。作为人工智能的一个子集,机器学习特别是监督式学习,部署算法基于样本数据(称之为“训练数据”)建立一个数学模型,并评估所建立的模型在独立数据(称之为“测试数据”)上的预测性能。机器学习的最终目标是确定哪种模型能够对未来的未见数据产生最准确和可重复的预测,以完成特定的任务(Mitchell,2006)。 机器学习利用分析模型,使用迭代方法从分析数据中进行自动化和持续化的学习,当训练学习的数据足够多时,通过反馈行动不断修正学习结果,可以识别稳健的模式并进行预测。机器学习和传统统计分析在很多方面类似,但在执行机制上有所不同。统计分析是基于概率论和概率分布,而机器学习的目的是找到最能预测结果的数学方程组合。因此,机器学习非常适合于分类、线性回归和聚类分析等问题。机器学习方法大致可以分为两类:监督学习和无监督学习。监督学习算法使用有标签的例子,这意味着有已知输出结果的输入。监督学习适用于历史数据可以用来预测未来结果的情况,例如确定哪些客户最有可能拖欠债务。无监督学习适用于输出变量上没有标签的情况。系统不会被“告知”假设的答案是什么,而是自己找出数据模式。无监督学习包含不同的技术,可用于交易性数据(如聚类分析),如果将其作为风险评估过程的一部分,有助于发现以前未预见的风险。除此之外,还有半监督式学习,它包含了标记和未标记的两类输出数据的组合。