当前,各级审计机关通过技术手段对结构化的审计电子数据开展了脱敏工作,但对于审计报告、审计案例等非结构化数据,由于敏感数据识别难度大、脱敏成本高,数据脱敏工作的难度较大。如何在确保数据安全的前提下,通过技术手段实现对非结构化数据的脱敏,为审计信息化建设提供数据支撑,是值得探讨和研究的方向。 审计电子数据脱敏的相关概念和目标 数据脱敏又可称为数据去隐私化、数据变形,是指在保留数据初始特征的条件下,按需制定脱敏策略和任务,对敏感数据进行变换、修改的技术机制。它可以在较大程度上解决敏感数据在非安全环境下使用的问题。 (一)脱敏模式 静态脱敏。静态数据脱敏一般用于非生产环境,将敏感数据从生产环境抽取并脱敏后用于非生产环境。静态数据脱敏操作先对目标数据识别定位,将其与预设的脱敏规则相匹配处理,并且确保脱敏结果与生产环境相隔离。审计信息化建设过程中一般采用静态数据脱敏模式。 动态脱敏。针对敏感数据采用数据抽取、数据漂白、动态掩码等数据脱敏脱密技术,主要用于审计人员在开展数据分析时,对返回的数据进行实时脱敏脱密处理。动态脱敏脱密应兼顾数据查询的安全性和可用性。 (二)脱敏目标 审计电子数据脱敏目标,是指在满足大数据分析和审计信息化建设需求的基础上,对审计电子数据实行脱敏操作,具体目标如下: 隐私保护。通过脱敏处理,隐藏或删除敏感数据,以保护个人隐私和敏感信息的泄露。如将用户的姓名、身份证号码、电话号码等进行脱敏处理,以防止他人通过这些信息进行身份识别或其他不当使用。 共享和使用数据。在某些情况下,需要共享或使用敏感数据,但又需要确保数据的隐私和安全。通过对数据进行脱敏处理,平衡数据的可用性和安全性,使得数据可以被安全地共享和使用。 数据分析和研究。脱敏处理可以在保护个人隐私的同时,允许进行数据分析和研究。通过对敏感数据进行脱敏处理,可以减少数据泄露的风险,同时保留数据的结构和特征,以支持数据分析和研究。 审计电子数据脱敏存在问题 (一)数据脱敏意识薄弱 目前,部分审计机关在开展工作的过程中缺少脱敏意识,存在一定的安全隐患。一方面,在开展信息化建设过程中,大多专注于系统功能目标的实现,对在建设过程中所涉及的相关电子数据,缺少脱敏意识。另一方面,在开展大数据分析时,数据安全管理不到位。主要表现为对查询结果中的敏感数据字段未进行脱敏处理,如身份证号码、银行账号、联系电话等敏感信息。 (二)技术和业务缺少融合 审计人员在开展数据脱敏过程中,存在数字化能力不足的问题,数据脱敏相关技术性工作主要由第三方人员来负责。但第三方人员往往只注重于脱敏技术的实现,却忽视了审计业务的实际需求,脱敏技术和审计业务融合度不高,导致相关业务需求难以有效落实。同时,数据脱敏是一项系统性工程,涉及敏感数据发现、敏感数据标识、脱敏效果评估等多方面内容,而目前审计系统内仍缺乏相关的技术储备。 (三)数据脱敏成本较高 审计电子数据脱敏的关键在于对敏感数据的识别。对于结构化数据,如经过数据治理形成的标准表数据,可以通过标准表的数据字段名称进行敏感数据的识别。但对于非结构化数据,如审计报告、审计案例、审计信息等数据,则难以通过技术手段进行敏感数据的识别,只能通过人工方式进行识别,导致脱敏工作量巨大、脱敏成本较高。 审计电子数据脱敏的重要性和必要性 审计电子数据安全是审计事业的生命线。审计机关在工作开展过程中,收集了大量敏感信息的电子数据。敏感数据主要包括:个人隐私数据、被审计单位电子数据、审计机关自身业务数据,还有数据分级分类之后安全级别较高的核心数据。在数据共享、数据分析以及信息化建设过程中,通过开展数据脱敏工作,保障数据使用安全,是十分必要的。 (一)数据脱敏是相关法律法规合规要求 许多法律法规和行业标准要求对特定类型的数据进行保护和脱敏处理。《中华人民共和国数据安全法》《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》等法律法规,明确了关于个人信息保护的规定,其中包括对个人敏感信息的脱敏处理,明确对个人隐私的保护。 (二)数据脱敏是数字化建设的基础保障 在审计数字化改革背景下,各地审计机关都聚焦于计划编制、项目实施、问题整改、成果运用等关键环节,积极推进审计信息化建设。其中,审计电子数据是基础,数据脱敏是关键。如基于审计报告中反映的问题开发审计知识智能推荐系统,在开发前需提前精准识别出审计问题中的敏感信息,在完成脱敏的基础上,才能开展信息化建设。 (三)数据脱敏是大数据审计的安全保障 目前,部分审计机关存在未根据数据敏感等级制定相应的脱敏规则和开展数据脱敏工作的问题。大数据技术是审计发现问题的重要手段。审计人员在基于审计电子数据开展大数据分析过程中,由于审计电子数据多涉及各类隐私和敏感数据,分析结果数据应根据脱敏规则进行实时脱敏,以保证数据在分析使用时的安全。