基于时空行为大数据的城市社会空间分异研究

作 者:

作者简介:
陈梓烽,中山大学地理科学与规划学院,广州 510006 陈梓烽(1989- ),男,广东深圳人,博士,副教授,主要研究方向为城市地理学与行为地理学。E-mail:chenzif5@mail.sysu.edu.cn。

原文出处:
人文地理

内容提要:

本文对基于时空行为大数据的社会空间分异研究进行了阶段性总结,梳理了主要的研究进展、并展望未来的研究方向。已有研究利用手机数据、社交媒体数据、交通运行数据三类时空行为大数据,在多个方面推动了社会空间分异研究的进展,包括揭示了社会空间分异的多尺度动态性、实现了时空共存下个体社会环境暴露的精细化测量、丰富了社会空间分异研究的社会网络与主观认知视角;但这些研究大多止步于现象层面的关联性分析,缺少对社会空间分异深层次机制以及理论、政策外延的剖析。未来研究需充分挖掘时空行为大数据解读社会空间的潜力,通过深入理解社会空间分异的时间性、再思社会空间分异与社会融合的关系,拓展研究的理论与政策外延。


期刊代号:K9
分类名称:地理
复印期号:2023 年 02 期

字号:

       修订日期:2022-03-10

       中图分类号:K901 文献标识码:A 文章编号:1003-2398(2022)06-0072-09

       DOI:10.13959/j.issn.1003-2398.2022.06.009

       1 引言

       伴随着城市研究的“移动性转向”[1],传统的基于居住地视角的城市社会空间分异研究正面临反思[2,3]。运用以时间地理学为核心的时空行为研究方法论[4-6],分析居民在整日的活动空间中的社会互动机会,已成为社会空间分异研究的重要趋势[7-11]。得益于研究数据的多元化,时空行为视角下的城市社会空间分异研究的理论与方法正不断完善[12],其中近10年来兴起并快速发展的时空行为大数据[13-20]为研究的推进提供了有力的支撑。

       时空行为大数据具有传统的时空行为调查数据所不具备的样本量庞大、时效性强以及时空覆盖面广等优势,同时也有社会经济属性信息不完整等局限性[18,19],这些特征导致了基于时空行为大数据的社会空间分异研究的侧重点往往有别于传统数据,并因此形成独特的研究贡献。经过近10年的发展,基于时空行为大数据的社会空间分异研究已有一定的实证积累,有必要进行阶段性的总结,梳理已有研究用到的各类数据、分析方法及主要的研究发现,为未来研究的进一步深化与创新提供参考。

       目前,国内外学者已分别针对时空行为视角下的社会空间分异[2,3,12]以及人文地理学研究中的大数据应用[13-20]两方面的文献进行了总结与评述,但在基于时空行为大数据的社会空间分异研究方面尚缺少系统性的回顾。本文首次对基于时空行为大数据的社会空间分异研究进行阶段性总结,从数据、分析方法及研究贡献等方面梳理研究进展;同时,通过审视时空行为大数据的局限性,本文尝试为基于时空行为大数据的社会空间分异研究的未来发展指出方向。

       2 基于时空行为大数据的社会空间分异研究基础

       近10年来,传感器网络、移动互联网等信息技术的快速发展,为城市时空行为研究提供了日益丰富的新数据(即本文所称的“时空行为大数据”),例如由移动运营商或手机应用程序自动记录的个人移动轨迹数据、由小汽车或共享单车上安装的GPS设备记录的车辆移动轨迹数据、由城市交通基础设施(如城市道路的监控设备、公共交通的自动收费系统、高速公路的收费系统等)记录的交通运行信息、由社交媒体用户发布的信息等。这些时空行为大数据成为了活动日志调查数据等传统时空行为数据的重要补充。本节聚焦应用于社会空间分异研究中的三类时空行为大数据,梳理各类数据的主要特征,总结与这些数据相适应的社会空间分异基本分析方法。

       2.1 数据基础

       目前,应用于社会空间分异研究中的时空行为大数据主要包括手机数据[21-37]、社交媒体数据[38-45]及交通运行数据[46,47]三种类型(表1)。手机数据包括呼叫详细记录(Call Detail Records,CDRs)以及手机信令数据。前者记录了手机使用事件(即接打电话或收发短信)所关联的主被叫的编码、通话时间、邻近基站位置等信息,个体位置信息只有在接打电话或收发短信的触发下被记录;后者周期性(如每隔1小时)记录手机用户的邻近基站位置。由于手机的普及程度较高,因此手机数据比其他类型的大数据更贴近人口分布的实际状况[48],即有较高的样本代表性。但相比于其他类型的大数据,手机数据的获取成本较高,并且在隐私保护的约束下可能仅能获得汇总的起讫点数据,而无法获得个体轨迹信息。

       社交媒体数据来源于用户使用社交媒体平台(如脸书、推特、新浪微博等)过程中所发布的地理位置标签以及文本、图片等信息。部分数据集还包括社交媒体用户之间的好友关系信息。相比于其他类型的时空行为大数据,社交媒体数据的形式更为多元化,其中用户发布的文本、图片等信息具备了质性数据的属性。并且,研究者可以以非常低的成本,通过应用程序接口(Application Programming Interface,API)获取全球范围内大量的社交媒体数据[49]。然而,由于社交媒体平台的普及程度有限,社交媒体数据面临较严重的样本偏差问题[50]。此外,由于用户通常偶发性地使用社交媒体平台,社交媒体数据中的移动轨迹信息往往不具有连续性[51]。

      

       交通运行数据包括公交卡数据、车牌识别数据以及浮动车数据等。公交卡数据由公共交通(公交车、地铁)的自动收费系统产生,记录了公交卡持有者出行的相关信息(如起讫车站、出行时间、费用、公交线路等)。车牌识别数据产生于城市道路的监控摄像头对每辆通过的车辆的连续抓拍,记录了车牌号、视频监控点编号(位置)、通过时间、车辆类型等信息。浮动车数据产生于车载GPS设备所记录的出租车或其他车辆的位置坐标、瞬时速度、行驶方向、运行状态(如是否载客)等信息,是较早被应用于时空行为研究的一类大数据,但在时空行为视角下的社会空间分异研究中的应用偏少。上述交通运行数据均只能反映使用特定出行方式的群体[20],因此同样面临样本代表性不足的问题。但相比于手机数据(周期性或触发式地记录空间位置)和社交媒体数据(由用户自主发布地理位置信息),交通运行数据具有时间精度更高、地理位置信息更真实的优势。

相关文章: