修订日期:2012-10-09 1 引言 信息与通讯技术的广泛使用产生了海量时空数据,基于此的人类移动性(Human Mobility)研究也逐渐成为热点[1-7]。由于具有多维度、高精度、支持行为轨迹分析和适用于大规模数据分析等特点[4],手机移动定位技术在研究人类移动性方面应用广泛,其中包括:移动轨迹的地理可视化[8]、旅游等出行方式的研究[9-10]、通讯工具的使用对出行的影响研究[11-12]、个体的移动性规律与模式挖掘[13-19]、个体移动轨迹的预测[20-21]、城市内部宏观活动特征与结构[22-23]等。在人类移动性中,随时间而变化的空间位置是其最基本反映,以往的研究大都着眼于数据记录时刻个体所在空间位置及其反映的活动模式,而忽略了相邻两个时刻之间的移动过程及其对区域空间结构的影响。而在实际的移动过程中,数据记录的个体会在当地的道路交通网络上产生交通流量。 在基于自动感应设备采集交通信息数据的研究中,常用的数据来源包括路面传感器、车载GPS和手机基站网络,其中路面传感器只能采集网络中少数固定点的交通信息,车载GPS由于信号多路径(Signal Multipath)和城市峡谷阻塞(Urban Canyon Obstruction)问题在城区效用并不高。手机基站网络虽然精度较低,但是移动设备的广泛使用和基站的大量铺设提供了海量的个体时空数据,通过聚合与处理,结合个体属性数据,与传统交通信息数据互补,为模拟交通流量、理解出行行为和规划交通网络提供了有力的手段[24]。因此,本研究将利用手机基站数据模拟城区交通流量,在此基础上对区域内不同等级道路的流量分布进行分析,探讨其在城市道路网络中的功能和地位,并通过对比前人基于车载GPS的研究结果,验证本研究方法的可行性和准确性。 为了还原一定时段内城市道路交通网络的使用情况,探讨不同等级道路的功能地位和道路网络总体流量分布特征,本研究通过编写基于ArcEngine 10.0的C#程序,利用其中的Network Analyst模块库,从对移动过程进行模拟还原这一动态角度出发,将手机移动定位数据与道路交通网络结合起来,通过对大规模样本的模拟,将数据反映的个体空间位置的移动过程具体化,在网络中模拟根据最短路径原则所生成的交通流量。因此,本研究基于交通行为作为一种大量个体时空行为总和的本质特征,利用手机基站数据可方便快速获取大规模实时移动数据的优点,提供了一种新的模拟历史时期一定时段内交通流量空间分布的方法,并为交通网络流量的分布模式分析和未来交通规划奠定了数据基础。
图1 道路网络与基站范围 Fig.1 Distribution of traffic network and cellular base stations 2 研究区与数据来源 本文研究区为某省会城市的中心城区,2010年总面积近200km[2],建成区面积约50km[2],总人口100多万,GDP500亿元以上。区域内道路交通网络由国道、省道、高速公路和城市内主次干道组成,总长约1500km,其中包括3条国道和6条高速公路。 选取该研究区的原因包括以下3点:①人口数量大,可提供海量的手机用户数据进行模拟;②经济发达,基础设施如手机基站网络的建设较好,采集的数据质量精确可靠;③道路交通网络健全,个体的位置变化大部分倾向于沿道路网络进行。这些条件对于个体移动模拟的准确性至关重要。 本文使用的数据为城市道路交通网络数据和手机基站数据。其中,城市道路交通网络数据包括国道、省道、高速公路、城市道路、市区道路、市区杂路6个图层,来自2007年国家基础地理信息中心基本数据集中与道路相关的6个同名子目录,图层间道路无重复无遗漏。手机基站数据包括区域内的手机基站位置空间分布图以及2007年7月某天的匿名化处理后的各基站话单数据。其空间分布见图1。 从图1可看出:手机基站的分布密度随区域内人类社会经济活动的增强而升高,表现为从城区外向城区内逐渐密集;高速公路与国道建立了城区与外部的连接,而省道除了连接城区内外,也构成城区内的道路网络骨架;城市道路是东部城区的主干道路,市区道路在上述道路基础上对网络进行了加密,市区杂路则在市区道路的基础上进一步加密并提供了小区尺度上的可达性;两大类型的道路在功能和接驳上分配较为合理,构成了当地健全的道路网络。
图2 最短路径计算示例 Fig.2 Calculation of the shortest path 注:图中1、2分别为起始、终止点,3、4和5、6分别为离1、2的最近路段的两个端点 3 研究方法 为了利用手机基站数据对一天内的交通流量进行估算,就需要对数据记录的每个个体的移动进行模拟。当个体使用手机进行通话或发送短信时,其通讯业务会由距其最近的基站负责处理,由此产生一条话单记录。而如果在总的话单数据中该个体的手机号出现了两次或两次以上,则可以捕捉到个体移动的轨迹,数据中按时间先后形成的基站序号即为其移动轨迹中的重要节点。通过对所有个体的序列进行合并,得到每对基站间个体移动的总量。