大数据与小数据结合:信息时代城市研究方法探讨

作 者:

作者简介:
秦萧(1987-),男,江苏盐城人,博士,南京大学建筑与城市规划学院助理研究员,主要从事大数据与城市规划方法研究,E-mail:x.qin@nju.edu.cn;甄峰,南京大学建筑与城市规划学院(江苏 南京 210093)。

原文出处:
地理科学

内容提要:

信息技术的快速发展引起了城市研究领域的“大数据”热潮,并带来了传统城市研究方法的变革。但是,其自身存在的诸多缺陷使得学者不得不重新考虑传统小数据的应用角色。但是,传统小数据并没有失去其应用价值,相反,以城市与居民行为活动关系研究为主体的信息时代的城市研究必需充分结合大数据与小数据,并探讨适宜的方法论与方法框架,从而应对日益复杂的城市问题和居民需求。提出“物质空间与活动空间结合”、“相关关系与因果关系结合”、“宏观分析与微观挖掘结合”的3个方法论,并在此基础上构建了“大样本空间发展评价+空间差异与联系发现+小样本影响因素探究”、“小样本模型构建+影响因素发现+大样本验证及挖掘”、“微观活动分析+活动空间界定+影响因素探究”3种方法框架,且分析了这些框架的具体应用,以期为未来的城市研究提供思路和方法借鉴。


期刊代号:K9
分类名称:地理
复印期号:2017 年 04 期

字号:

      从2012年开始,“大数据”这个词汇在城市地理、社会地理、城市规划等学科逐渐掀起了较大热潮。学者们纷纷意识到传统基于统计资料、问卷调查、基础地理信息及访谈数据的城市研究思路与方法存在忽视微观个体行为与需求、样本较少且不精确、研究范围狭隘、成本较大等方面的较大缺陷[1-4],其科学性受到了质疑。加之,信息通信技术的快速发展,网络数据、智能、智能卡、GPS、监控与传感设备数据等反映微观大样本量居民活动和城市各环节运营大数据的出现,无疑给城市及相关领域研究带来了划时代意义的机遇,传统研究范式也开始发生转型[5,6]。在居民行为研究领域,GPS轨迹捕获替代了活动日志的调查,可以更加精确了解居民出行和活动时空信息,研究居民行为与城市环境之间的关系[7]。在城市空间研究领域,通过对主题网站、智能手机、智能卡等居民活动数据的综合分析,可以了解城市居民对空间的利用方式与效率及质量评价,判断城市各类空间发展存在的问题[8-13]。在区域研究领域,社交网络活动、移动通信等大数据被用来表征城市的综合实力、城市间时空联系及空间结构,进而重新认识和界定区域内部发展关系[14,15]。由此可见,“大数据热”的背后是传统城市研究从微观到宏观多层面理论和方法的转型,居民行为与活动大数据分析成为这一转型的核心环节。

      然而,在实证研究中,除了大数据具有冗余处理技术、涉及个人隐私等方面挑战[16],其应用还存在诸多问题。首先,大数据往往很难代表全样本[17-20],特别是网络数据的应用,样本用户只占城市所有居民的一部分,且更倾向于年轻、较高学历群体,对这些特定群体的分析与研究并不能十分准确反映城市真实现象。其次,大数据并非全部共享数据[21],虽然网络数据是公认的较为容易获得的数据,但是手机、智能卡、视频传感设备等涉及个人隐私、商业机密、城市安全的大数据确很难被研究者所获得和共享,而正是这些数据才是研究居民行为、企业运行及城市问题的关键所在。最后,大数据之所以引起研究热潮,因其可以发现传统统计手段无法精确预测的城市现象间的相关关系,但是却难以说明这些现象间的因果关系[22,23]。例如,通过手机信令数据分析,研究者能够知道城市居民的时空活动变化,却很难明白居民为什么聚集到某个城市空间、如何聚集、哪一类群体更容易聚集等问题[34]。因此,随着大数据逐渐被应用到城市研究之后,以上总结的这些数据缺陷越来越凸显出来,学者们也开始质疑其科学性。特别是,重相关关系、轻因果关系的研究范式,使得传统城市研究中的计量统计和质性分析方法受到了较大忽视。

      事实上,虽然大数据可以提升小数据的质量和精确性,但是其无法取代小数据,两者的关系是相辅相成的[21,22,24,25],可以相互补充[24]、相互验证及佐证[16,19]。问卷调查不仅可以主动获得居民活动或城市现象信息,还可以捕捉受访人观念、态度、行为及个人基本属性等更为详细的个体信息。大数据则通常是对已发生活动或事件的被动记录,无法根据研究者需要进行数据获取。更重要的是,结合更为详尽的、符合研究需要的个体信息数据,通过计量模型方法便可以找出城市各类现象背后的因果关系。同时,在特定情况下,问卷方法可以更有效反映全样本的基本特征,因其是以城市总人口为基础,运用科学的方法随机抽取样本。大数据,无论数量再庞大,也可能是总人口中的一部分,利用两者分析得出的结论可以相互验证、佐证。可以看出,大小数据在城市研究中具有各自的优势和缺陷,两者的结合应用成为了必然趋势。但是,目前学者更多只是提出了大小数据结合的必要性,较少关注两者如何结合应用。本文试图探讨大小数据结合的信息时代城市研究方法论和具体方法框架,倡导未来城市研究中多源数据融合、多方法集成、多学科交叉的创新方向。

      1 信息时代城市研究方法论

      信息技术的快速发展,特别是大数据的出现,使得城市研究领域发生了诸多新变化,但是这些变化并不单纯是由于数据获取视角和技术的革新,更多的是信息技术影响下传统城市研究科学化和人本化转型的必经之路,反映了研究思维的转变,需要在方法论层面对其科学性进行深入探讨。

      1.1 物质空间与活动空间结合

      传统的城市研究更多关注城市物质空间的内容,注重对空间分布、形态、结构等的探讨[26,27],而忽视了活动空间(包括经济和社会活动空间)的重要作用[1,28]。城市是由物质空间与活动空间共同组成的,两者相辅相成、相互影响。城市物质空间为居民的时空活动提供了空间载体,同时也时刻影响着居民的时空活动。居民的时空活动决定着其活动空间内部的路径、区域、边界、节点及中央活动区的具体状态,且随着时间的推移而不断改变,从而促进了城市物质空间的调整及优化。在这一过程中,无论是对城市的影响,还是对城市的研究,ICT或大数据的出现及应用都具有重要的意义:一方面,ICT的出现和广泛使用,在促进了居民活动破碎化的同时也增加了其弹性,居民的活动空间越来越向“流空间”转变,必定会带来传统城市物质空间形态和组织的变化。另一方面,ICT为城市物质和活动空间研究提供了不可或缺的数据。这就要求将大小数据结合起来研究城市居民活动及其活动空间,发现居民生活需求及现有空间存在的问题,进而改造现有城市物质空间。

相关文章: