一、获取海量数据,作为分析的基础 保险公司需要汇总、收集所辖不同层级、不同分支机构在经营中产生的所有相关数据。总公司层级的数据采集,能够有效避免受制于层级、分支机构所造成的数据不准确问题。保险行业之间共享数据,能使分析结果更加精准。 二、对数据进行加工整理,统一标准、口径 采集到的海量数据包含文本、语音记录、图片等半结构或非结构数据,容易出现数据混杂。甚至对于同一问题,由于分属不同的分支机构,涉及地域、人文差异,也会出现多样化的描述。需要利用文本挖掘(text data mining)、图片挖掘等数据分析工具,对数据、文本、照片格式等内容进行特征抽取、文本或图片的分类、聚类等操作,统一标准和口径,为深入分析做准备。 三、进行数据分析,构建动态的欺诈风险模型 1.对获取的数据,抽取关键风险场景要素。如在车祸事故中抽取出险时间、出险地点、驾驶人员、报案人电话号码、事故类型、损失部位、赔偿金额、领款人账号、电话等要素,获得基础数据。 2.对于数据进行多维度分析,发现关联关系。如车祸事故中可以对领款人、损失部位、修理地点、事故地点、同一组照片等进行分析,发现关联关系。 3.风险聚合,构建动态的欺诈风险模型 传统的风险控制体系,由于涉及不同的层级、分支机构,欺诈风险从单独的分支机构所获得的信息来看,可能并无异常,大数据分析方法实现了风险聚合,结合数据分析所发现的关联关系,构建出的欺诈风险模型,及时向分支机构发出欺诈风险预警;同时结合分支机构的实际运用结果,及时修改、完善,真正实现模型的动态调整,使得反欺诈能力大幅提升。 摘自《中国总会计师》(京),2016.9.16/155 《中国审计》(京),2016.22.41/42 《审计月刊》(武汉),2016.11.50~51