近几年,大数据技术应用在全世界发展迅猛,这一方面源于数据采集与处理技术上的能力拓展,而更重要的动力则是来自于我们已经开始能够利用一部分个人数据,包括:电子化交易及各种网络活动所形成的数字化痕迹等[1]。得益于大数据技术的运用,越来越多的个人数据开始被发掘并产生商业化价值。然而,对于应以何种方式使用个人数据,如何把握数据的充分利用与个人隐私保护之间的平衡,各国还没有形成统一认识,法律和制度约束缺失,隐私保护的技术保障也没有跟上,已经成为影响大数据技术应用进一步发展的关键挑战。 2014年5月,美国总统行政办公室发布了题为《大数据:把握机遇、坚守价值》的评估报告[2],对大数据技术的快速发展将会对经济社会产生的影响及面临的挑战做出了全面评价。评估报告认为,在大数据被用来造福社会的同时,也会产生社会危害,可能对保护公众隐私权、确保社会公平、反对种族歧视等美国核心价值观造成冲击,必须采取措施以防范这些潜在威胁。其中,大数据发展对公民隐私权的挑战被认为是这项新技术发展对于传统伦理和价值观念的最大冲击。 1 大数据发展中的隐私挑战 隐私权问题最早是1890年美国哈佛大学的沃伦与布兰代斯在《隐私权》的论文中提出的[3],而信息技术变革给人们工作生活带来便捷的同时,也带来了越来越多新型的个人隐私侵犯事件,隐私保护在数字化时代已经成为无法回避的问题。这提醒我们,在大数据发展初期,应充分认识开展数据隐私立法研究的迫切性。美国政府评估报告中指出了大数据发展中面临的主要隐私挑战。 1.1 “数字化排放”带来的威胁 信息技术正在改变着人们的生活方式,现代人的生活中,每天要进行形式各异的电子化活动。传感器、公众网络、移动应用程序等不断成为新的数据来源,电子化活动中,我们的一举一动都会留下痕迹,使人们的日常行为产生很多记录信息,或者说,我们每天都在进行着“数字化排放”,而且排放的信息量越来越大,其中,像药店票据、手机地理坐标、IP地址等记录,就会包含个人信息。随着数据分析功能日益强大,众多看似毫无关系的数据碎片,可能会被整合分析,识别或还原出个人行为特征,从而暴露个人隐私。如何保护这些数据及其中挖掘出的信息,并使之得到合法的使用,是当前面临的紧迫难题。 1.2 “大海捞针”的代价 随着处理器计算能力的增强、存储成本的降低以及算法性能的改进,科学家已经有能力收集并处理海量数据,并从中找出异常数据模式,这就是被称为“大海捞针”的数据挖掘方法。它能够为人们提供通过其他方法不能获得的深度信息,已经成为科学研究甚至大数据行业应用中重要的计算模式。例如,大样本量的个体基因数据集对于识别遗传变异对疾病的影响起到关键作用[4]。然而,在搜集到的海量数据内,隐含了许多个人隐私信息,这是大数据技术应用面临的另一项关键挑战。 1.3 个性化定制的后果 互联网用户浏览网站痕迹、购物过程等不同类型的记录数据被结合在一起,就能勾画出某个人的行为图谱,并可能分析出他们的个人偏好和行为习惯,从而可以进一步预测消费者的潜在需求,使提前为他们提供所需的信息、产品或者服务成为可能。个性化定制已经成为目前互联网应用的一大特色和亮点,它使人们既能有机会接触到尽可能多的新鲜信息,又避免了被铺天盖地的互联网信息所掩埋。实际上,这种个性化定制的过程同时伴随着个人隐私的发现和暴露。数据挖掘与信息整合技术在使大数据功能日益强大的同时,也对目前个人隐私的保护带来了严重的冲击。 1.4 数据保存的影响 在过去传统的信息传播与保存方式下,人们可以通过信息自然消亡的方式来保护隐私。比如,在经过一定周期后,纸质材料自然毁坏或被销毁,上面的记录信息随之消失。但在数字世界,信息可以被无损地拷贝、传播并且无限期地保存。以前存储数据的成本昂贵,现在大量数据可以储存在微小的芯片中,简单便捷。技术的进步使得数据一旦产生,就可能保持永恒有效。随着大数据的不断发展,会有越来越多的私人信息产生并在他人的控制下保存,其中,涉及的个人隐私信息保护的问题必须提前考虑。 1.5 大数据时代的儿童隐私保护 青少年是移动应用与网络社交平台等新型互联网应用的最活跃用户。当他们使用这些网络应用时,他们的个人信息也会在不经意中被记录与存储,其中,可能包含个人隐私等敏感信息。相对于成年人,儿童对于个人信息和隐私泄露往往不在意,也不具备必要的自我保护能力。这些无意中被保存的数据有可能在他们成人后对他们的生活产生影响。如今,这类互联网隐私信息侵害行为正在不断发生,如何在给儿童提供互联网探索与学习空间的同时,又确保他们不至于因一时的疏忽而在日后受到挥之不去的侵扰,是世界各国都需要认真思考的问题。 2 美国的应对与计划 面对上述挑战,《大数据:把握机遇、坚守价值》评估报告建议,美国政府应通过制定政策与法律来约束和规范新技术的使用,从而在一定程度上维护个人隐私受保护等基本价值观。 2.1 研究元数据保护措施 “元数据”是关于数据的数据,用于描述数据自身特征。相对数据内容本身,以往元数据被认为透露了较少的信息,利用价值不大,往往不作为隐私信息进行保护。随着大数据技术的兴起,大量分散的数据记录可以重新整合,可能提炼还原成为个人的隐私材料,元数据从此有了新的地位与价值,针对元数据的保护措施也需相应进行调整。未来,元数据作为大数据世界的重要成员,将会被发现有越来越多的利用价值,应该得到更为周密的隐私保护。评估报告认为,随着大数据时代的到来,美国政府应加强对元数据保护政策的研究和制定,对数据服务提供商的行为进行规范并加强监管。