修订日期:2015-12-24 DOI:10.11821/dlxb201604003 1 大数据与社会感知 随着大数据时代的到来,学者们认识到了大数据对于地理学以及相关学科(如城市规划、环境保护、交通等)研究的机遇和挑战[1~4]。目前,关于大数据并没有一个标准的定义[1]。考虑到大数据这一概念的出现与传感网、移动互联网等信息技术的发展密切相关,通常把如下途径获取的数据归于大数据的范畴:直接的(如监控设备采集的视频影像)、自动的(如手机、公交卡获取的数据)、志愿的(如社交媒体数据)[3]。其中第二、三类数据近年来在地理研究中受到了广泛关注,其共同特点是每条记录具有时空标记并且可以关联到个体,而一个数据集中包含了大量个体的行为信息。在本文中,地理空间大数据特指这两类数据。目前研究较多的地理空间大数据有手机数据、公交卡数据、出租车轨迹、社交媒体数据等。 对于一个个体而言,其空间行为具有随机性而难以提取有价值的规律特征。然而,当样本变大,一个群体的行为的规律性就较为明显,这种规律性与地理环境,尤其是地理环境中的社会经济特征有关。因此,地理空间大数据为人们进一步定量理解社会经济环境提供了一种新的观测手段。最近,Liu等提出了“社会感知”(social sensing)概念及研究框架,指出社会感知是指借助于各类海量时空数据研究人类时空间行为特征,进而揭示社会经济现象的时空分布、联系及过程的理论和方法[5]。社会感知数据可从三个方面提取人的时空间行为特征:①对地理环境的情感和认知(如基于社交媒体数据中可以获取人们对于一个场所的感受);②在地理空间中的活动和移动(如基于出租车、签到等数据可以获取海量移动轨迹);③个体之间的社交关系(如基于手机数据可以获取用户之间的通话联系信息)。社会感知研究框架包括人、地、时三个基本要素。首先,在“人”的方面,社会感知数据可以获取人的活动与移动、社交关系、情感与认知等行为模式;其次,在“地”的方面,可以基于群体的行为特征揭示空间要素的分布格局、空间单元之间的交互以及场所情感与语义;最后,从“时”的视角,可以发现地理过程(尤其是人文地理过程,如城市空间结构演化)的规律和特征。与社会感知手段相比,传统的遥感技术利用光谱特征等获取地物信息,但无法有效感知社会经济环境特征,而大数据包含丰富的人群时空间行为信息,形成了对传统遥感数据的有力补充。 在传统的人文地理学研究中,由于样本量通常较少,难以直接根据人的行为特征去推断地理环境。而根据社会感知框架,相关研究主要有如下几个方向:①基于活动时间变化特征分析用地功能[6~8];②基于空间交互发现城市或区域的空间结构[9~10];③基于社交媒体语义数据提取特定地理事件与地理环境特征[11~14]。正如这些研究所展示的,大数据使基于人的时空行为感知并理解地理环境成为可能[5]。回顾人文地理学发展的几次转向,计量革命因为缺少对人的关注而受到批评,而后期行为主义则受限于样本太小,缺乏定量模型。大数据的出现以及相关的社会感知手段研究,在一定程度上弥补了上述两个方面的不足,对于地理学尤其是人文地理学研究具有重要意义。对于地理信息系统与科学而言,大数据的意义体现在两个方面。首先,大数据管理和分析需要研究实现新的数据模型和空间分析方法;其次,大数据也为实现以人为本的地理信息系统提供了支持[15]。 地理空间大数据及其提供的社会感知手段,带来了全新的研究范式,促进了人文地理学的研究[16],也有助于重新审视地理学研究的一些基本问题。由于空间分布和空间交互是地理学研究的两个重要传统[17~18],它们共同表征了空间异质性(spatial heterogeneity),而定性方法与定量方法是人文地理学研究的两条重要途径,因此,本文围绕空间分布和空间交互以及定性方法和定量方法这两组问题,归纳最新研究进展,并探讨社会感知支持下的空间分布和空间交互研究,以及如何从“人”和“地”这两个视角去集成地理学中的定性与定量方法。 2 空间分布和空间交互 空间异质性是地理学的基础概念,它表现为观测变量的一阶分布(distribution)以及场所间二阶交互(interaction)的时空变化特征。空间分布和空间交互在现代地理学研究中受到广泛重视,Ullman、Hartshorne、Castells等著名学者均对此问题进行了探讨[19~21]。Tobler地理学第一定律正是阐述了分布的空间依赖(spatial dependence)及交互所受到的距离影响,从而在理论上支持相关的空间建模与分析[22~25]。 2.1 感知空间分布和空间交互 大数据同时提供了对于空间分布和空间交互的感知手段。首先,人类活动密度的空间差异及时间变化表达了相应地理现象的分布特征,如图1a所示,利用超过50万用户一年内的社交媒体签到位置,展现了中国城市化程度较高的区域以及主要交通干线的空间分布特征。