在中国,“大数据”这个词在最近的一两年变得格外火热。在有关大数据的热烈讨论中,也时不时地有泼冷水者。无论是热炒还是冷思考,我们需要看清的是,大数据究竟只是一个过眼烟云的概念,还是一个将深刻影响未来的大趋势。 尽管新媒体时代的确有不少热门概念转瞬即逝,但我们也看到,有些概念经受住了时间的考验。“互联网”这个在当年与大数据一样热的词,在今天已经不仅仅是一个概念,而是成为了我们生活的一部分,成为影响社会发展的重要力量。 同样的,“大数据”这个概念的出现,是信息时代这个大的背景,它也与社会化媒体、移动传播、物联网、云计算等技术应用紧密相关。可以说,它是各种技术的综合产物,也会因各种技术的发展而不断演进。 从目前大数据技术展示出来的能力来看,大数据技术的影响将是深远的,甚至很多影响也许是我们今天无法想象的。对大数据技术,我们当然要保持冷静的观察,不能指望大数据能改变一切,也不能把大数据这个概念套在一切现象上,但是,如果它将成为未来的必然趋势的话,那么我们没有理由因为它太热,而有意地回避或逃避。 对于新闻业来说,现在要完全判断大数据技术将如何改变新闻业的生产方式,也许并不容易,但至少有一点我们已经看到,那就是,新闻生产过程中的信息资源,即新闻中的事实、要素、背景等信息,其来源将发生结构性变化。物联网中传感器采集的数据(包括移动互联网中的地理位置数据)、社会化媒体中的用户生产内容(UGC)以及新媒体中的各种用户数据,将得到更为广泛与深入的应用。也就是说,非专业媒体人甚至是非人工采集的信息将占有越来越大的比重。 在大数据等技术支持下,新闻中所需要的信息资源,将越来越多地通过自动的方式进行采集,并通过相关的技术进行过滤、分析,新闻的深度、个性化程度也会在技术的支持下得到加强。 新闻信息资源的结构性变化,也会导致新闻业务形态的变化,目前在国外开展的“传感新闻”、“机器人新闻”尝试,正是代表了在数据技术驱动之下传媒业新的探索。 一、物联网数据与“传感新闻” 今天关于大数据的很多案例,都是指向对用户数据的分析、对用户生产内容(UGC)的利用等方面,但是,从发展趋势来看,大数据时代一个重要的数据来源,是物联网。 物联网的概念是在1999年提出的。物联网技术是通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络。物联网也就是“物物相连的互联网”。物联网的重要特点是,自动采集物体的信息,并根据需要将这些信息发布到互联网上。 当然,这个“物”,也包括“人体”。手机、人体传感器以及“谷歌眼镜”、智能手表等可穿戴设备的进一步发展,将可以更方便地采集人体和与之相关的信息,并将它们通过互联网传播。 大数据技术之所以成为必然趋势,也与物联网的发展分不开。物联网一旦普及,将使得数据的量级以惊人的速度发展。 物联网的基础是安装在各种物体上的传感装置,它们是信息的采集手段。虽然不同物体上的传感装置及工作原理不尽相同,采集的数据也有所差异,但是,没有传感器,就没有物与物的相联。 一些美国媒体已经开始研究如何借助传感器搜集即时数据来进行报道,并且将这样一种探索称为“传感新闻”(Sensor Journalism),尽管在这个名义下进行的实验所采用的传感装置有些还比较原始。 这其中一个代表性的个案是美国纽约的WNYC广播电台的约翰·基菲(John Keefe)发起的一个项目,他和一些志愿者利用自制的传感装置,来预测“17年蝉”的出现,其依据是,当地下8英寸的土壤温度达到64华氏度时,这些蝉就会从地底冒出①。 美国的Public Labs发动路易斯安那、密西西比、阿拉巴马和佛罗里达等地的自愿者利用带有照相功能的气球和风筝等探测设备进行航拍,以反映海湾地区的石油泄漏情况,各地人们拍摄的这些航拍图,揭示出海湾地区石油泄漏的范围与程度。他们希望这些资料能为环境研究以及相关的政策的改善提供依据。虽然这算不上一个新闻报道,但是这一项目同样可以给媒体带来启发。 Pachub(现发展为Xively)是一个物联网信息分享平台,它帮助全世界用户共享来自物体、设备、建筑和环境的传感装置的实时数据,其中一些传感器数据可以帮助人们实时地了解自己周围的空气质量。这个平台也被“传感新闻”的研究者所关注。 美联社的记者们也已经开始通过与手机连接的传感装置,来监测空气质量并进行实时报道。 有研究者认为,目前一些天气预报和交通方面的报道已可以称为“传感新闻”。 一些新闻院系和研究者也开始关注“传感新闻”,哥伦比亚新闻学院甚至计划建设一个“传感新闻实验室”。 虽然目前在美国进行的“传感新闻”实验,大都还没有采用物联网技术,并且主要是通过志愿者参与探测、传感工作,但是它们已经揭示了一种可能,那就是,探测、传感装置可以成为媒体人的助手,在人力所不能及的地方进行信息的采集。在更先进的物联网技术支持下,数据的采集会变得更为准确、持续,它们能给新闻报道带来更广泛、庞大的数据资源。