大数据时代的到来给高校档案管理带来了颠覆性的变化。为满足日益便捷化、高效化、多样化的档案信息需求,高校审计档案也需要借助数据库、关联数据、数据挖掘、云计算等大数据技术,探索新时期高校审计档案信息化转型路径,强化审计档案数据资源建设,创新审计档案数据开发利用方式,促进高校审计档案数据资源的开放共享、深度开发及有效利用。 一、利用数据库技术加强高校审计档案资源建设 高校审计档案是高校审计部门在项目审计或专项审计调查过程中直接形成的纸质、磁性载体、光盘等形式的历史记录,其归档范围包括结论类、证明类、立项类、备查类审计文件材料。大数据时代下,高校审计工作对于数据采集、存储、挖掘等信息化需求也在不断提高,云审计这一新兴的审计模式也随之产生。通过建立云审计系统,用户和审计人员可以在云平台上存储并获取各种电子审计文件,以共享审计信息资源。 (一)高校审计电子档案收集归档 高校审计档案信息化建设,首先要开发数据库系统。高校审计及档案工作人员必须全程参与开发,在需求分析、系统定义、系统目标等方面提出充分意见。大数据时代的高校审计档案管理可实行纸质和电子档案双轨双套制。审计人员应及时收集所审项目的文件材料,做到及时、准确、相关和完整。审计电子档案也应按照审计流程同步收集,以每个审计项目为单位,实行谁审计、谁立卷,边审计、边收集,审结卷成的原则。项目审计过程中内部生成的审计报告、工作底稿等审计电子文件,可以直接著录到学校的档案管理信息系统。外来的送审结算文件,可随同纸质文件同时报送电子文件。在项目终结时,要对形成的全部材料进行整理和鉴别,按立卷规则进行组卷、编目,同时将纸质文件和电子文件移交档案馆。 (二)高校审计电子档案安全管理 数据库系统存在着数据非法访问和修改的风险,意外事故、操作失误也都有可能造成档案信息的损坏或遗失。所以,确保高校审计档案信息系统的安全,首先必须确保该系统运行环境的良好。高校审计和档案部门要制定严格的系统运行和维护的相关制度,加强审计人员的系统安全知识教育,落实安全责任认定,加强对系统安全的管理。同时,加强系统软硬件技术性能、网络安全建设,提供高性能的系统技术运行环境。其次,要做好系统的物理安全控制和逻辑安全控制。要通过不同介质定期对审计电子档案进行多套备份,并定期检查备份的内容。通过设定密码权限,对用户的身份和权限进行限制,同时对数据传输和存储进行加密,以确保数据不会被非法获取或窃取,保障审计电子档案的真实性和完整性。 二、通过数据挖掘技术完善高校审计档案检索利用 数据收集和存储技术的快速发展积累了海量的大数据,数据挖掘是一种从大量不完整、模糊和随机的数据中提取人们事先不知道的隐藏信息的过程。在传统的档案管理中,基于关键词的简单检索技术,难以从大量的档案数据资源中获取所需要的信息。在大数据背景下,高校档案部门迫切需要开发出一种简便有效的工具,从大规模的文本信息资源中提取出符合要求的、简洁精炼的信息。 (一)挖掘高校审计档案资源的潜在价值 数据挖掘技术旨在对海量的档案资源进行有效的挖掘和整合,而高校档案馆的档案资源多是以纸质档案、特殊载体档案和电子文件等方式存在于馆藏资源数据库。数据挖掘技术可针对高校审计档案资源深入挖掘,开展科学分析,利用数理统计工具、算法工具、信息聚合技术等手段,发掘档案资源中隐藏的价值,实现对档案资源中可能存在的信息的有效聚合,从而发掘档案资源中存在的价值。在高校审计档案利用方面,当用户的需求不在涉及某一具体档案,而是需要某类档案时,利用数据挖掘技术,可以将档案与主题相互关联,从多角度来综合展现高校审计档案的内容。 (二)提升高校审计档案信息的检索效率 检索是档案利用的重要途径。将档案形式特征、内容特征和其他信息数字化之后所形成的资料保存到数据库,并通过检索系统将结果资料返回,从而实现档案检索。档案信息检索中,所检索到的信息源以元数据为主,对某些元数据如主题词著录较少。运用数据挖掘技术,为高校审计档案资源的开发与利用建立的检索系统,既支持模糊检索、概念检索、多语言输入检索等多种检索方式,在可视化界面的辅助下进行智能筛选,同时又能够快速地运用数据挖掘算法对检索结果进行准确分类和条理化展示。此外,还可以根据用户个性化需求对档案资源检索结果进行准确定位,从而提高档案资源检索效率。 (三)提高高校审计档案信息资源获取速度 为了确保利用者在最短的时间内通过线上信息检索系统对高校审计档案资源进行检索,可以根据不同利用者对档案资源检索的要求,分别设立信息检索专题,寻找那些被频繁访问的专题项目集。在项目集合上,通过算法工具实现用户浏览不同档案资源日志记录的相似性匹配,并在同一条数据链上整理出了拥有相同获取信息习惯的用户。针对用户的信息专题需求进行关联检测,找到事务库中频繁访问的专题集。当利用者通过档案数据访问界面对高校审计档案资源进行快速访问后,可以通过网络代理按照预置规则迅速做出反应,加快获取信息的速度,确保用户能够快速地获取到符合个人要求的档案资源。