中国人口省际流动重力模型的参数标定与误差估算

作者简介:
赵梓渝(1986- ),男,吉林长春人,博士,主要从事城市网络及人口流动研究,E-mail:171462539@qq.com,宁波大学公共管理系。宁波 315211;魏冶,通讯作者(1983- ),男,吉林梨树人,副教授,博士,主要从事城市与区域规划及GIS应用研究,E-mail:weiy742@nenu.edu.cn,东北师范大学地理科学学院。长春 130024;杨冉,东北师范大学地理科学学院。长春 130024;王士君,东北师范大学地理科学学院。长春 130024;朱宇,福建师范大学地理研究所。福州 350007

原文出处:
地理学报

内容提要:

空间交互模型被广泛应用于地理要素关系强度的模拟,然而目前大量研究或建立在模型参数标定理想化、模式化的假设条件下,或是在暗箱中完成,由此导致模拟结果与实际的偏差却被严重低估。基于2015年中国春运期间人口省际流动的城市间O-D数据,在逐日、分市的研究精度下,实证推算人口流动重力模型变量的回归系数,探究模型代理变量影响效应的空间异质性,并评估重力模型在人口流动模拟上的误差。结果显示:①重力模型参数标定的复杂性体现在交互对象代理变量影响程度的非对称性,和变量回归系数的空间异质性随研究精度加深显著加剧两个方面,因此模型参数标定的模式化将导致估算结果空间差异的趋势收敛;②2015年春运期间中国人口省际流动距离衰减系数为1.970,在地级行政单元视角下,人口流出地距离衰减系数值域为0.712(驻马店)-7.699(乌鲁木齐),人口流入地系数值域为0.792(三亚)-8.223(乌鲁木齐);③应用重力模型模拟人口流动结果与实测流(百度迁徙数据)存在显著误差。就加权绝对平均误差而言,拟合总误差为85.54%,其中空间相互作用效应造成了86.09%的实测流与模拟流的最大误差,相对流出力、相对吸引力分别造成57.73%、49.34%的模型误差。因此,空间交互效应仍然是当前最难以模式化的因素。


期刊代号:K9
分类名称:地理
复印期号:2019 年 02 期

字号:

      1 引言

      空间相互作用是城市地理学的基础理论,在形式上表现为一种交换、联系和互动,具有随距离延伸而不断衰减的特征[1]。重力模型和Wilson最大熵模型是20世纪70年代以来空间交互研究的两大基础模型[2]。两个模型主要区别在于距离衰减函数这一模型内核的改进,Wilson模型使用的负指数函数随着距离的增加,衰减速度比重力模型的负幂律函数快得多,因此在空间上的作用域有限,长程交互模拟偏少[3]。重力模型的幂函数具有无标度(scale-free)特征,暗示空间作用距离没有特征长度,从而使构造的空间过程模型与地理学第一定律没有矛盾[4]。

      重力模型的参数是特定地理系统总体特征的重要表征,也是模拟应用的前提和影响模型适宜性的关键因素。然而到目前为止,重力模型无论在理论研究还是实证应用中仍主要着眼于质量解释变量的种类扩展与类型细化,大量引入被认为影响空间交互关系的虚拟变量被视为增强模型解释力、提高拟合优度和研究有效性的重要手段,而不断被扩充变量的回归系数的标定却被严重忽视。不同的研究对象、时空背景、模型设定对应着不同的参数标定,但当前大部分研究或直接引用既有结论,或忽略代理变量回归系数的标定[5-7],直接导致相关研究难以对模型代理变量的作用效应做出科学的预期与判断。

      其次,距离衰减系数是对空间交互强度在地理距离上衰减速度的度量。不仅西方大量学者忽视研究的时空背景差异使用相同的距离衰减系数[8],国内学者重力模型应用大都引用刘继生等在2000年基于城市系统分形性质提出的“2值”结论[9],包括人口迁徙[10]、金融体系[6]、创新产出[7]、城镇体系[10-11]等各类型的研究对象。部分引力场模型应用将距离衰减系数赋值为1[12-14],也有学者认为该系数表征城市交互作用范围的尺度差异,其取值为1和2时可分别近似代表国家与地区尺度下城镇体系的辐射范围和影响距离[15-16]。然而,距离衰减系数反映了交互过程中研究对象所要面对的多重空间约束[17],其既受到模拟交互流类型的影响,如王成金实证推算指出中国城际公路、铁路、航空客流重力模型距离衰减系数分别为0.649、0.892和1.726[18];也受到研究区域时空背景的影响。理论上信息化、交通革命背景下,空间交互将呈现出明显的时空压缩效应,因此距离衰减系数也将逐年下降[19]。而在实证检验中,20世纪90年代以来中国铁路客流、物流的距离衰减系数却呈现出不断增长的趋势[18]。这表明近年来在中国城镇发展的空间极化和高速交通网络所带来的时空压缩的双重效应影响下,一个“2值”远不足以解释地理要素交互过程中所面临的空间衰减效应;另一方面距离衰减系数也与地图类型[20]、空间距离标定类型的选取有关。

      再次,从城镇体系到城市网络,重力模型是长期以来中国区域空间交互模拟的重要手段[15,21],然而针对模拟结果的误差却被研究者避而不谈,最终导致至今仍无法定论空间效应是否能够通过模型量化[22]。合理预期和控制估算模型的误差是保证科学严密性的基础。具体而言,通过重力模型进行空间交互强度模拟的误差到底有多大?误差产生的原因在于模型的自身缺陷,如尽管空间衰减现象已有理论假设曲线,但尚未有实证案例说明其适宜的数学模型[23];还是由于模型构建过程中变量选取的片面性、回归系数的标定缺乏特定时空背景下的针对性,导致解释力不足;抑或由于空间效应未能准确模拟而造成。如果对于这一系列因素导致的后果无法进行预期和给出一个合理范围的推测,那么,增加或改变代理变量的常用手段无非是在主观臆测下徒增研究结论的复杂程度。

      完善指标体系的构建、对模型参数的标定进行精确论证,是空间模拟过程严密性的前提及估算结果科学性的关键[24]。自然要素和社会经济要素的分布存在非均衡性,客流和物流是具有空间衰减规律的实体流,是城市空间交互关系的重要表征[17]。户籍制度改革通过破除居民特殊身份状态和降低落户门槛,打破了原有的城乡户籍壁垒和行政干预资源配置机制[25],2013年中国流动人口达2.4亿,已经成为全球人口流动最为活跃的地区之一[26]。转型期中国社会结构、文化背景和特殊的发展时期形成了春运这一带有显著时空规律性、高度行为集体性的社会现象[27]。本文基于2015年中国春运期间301个地级及以上行政区划间人口省际流动数据,在春运期间全国、分市、逐日分市三个递进时空视角下实证估算人口流动重力模型代理变量的回归系数,探究回归系数的空间异质性,并评估重力模型在人口流动模拟上的误差,旨在指出重力模型参数标定的复杂性、以及模拟结果存在误差的现实情况。

      2 数据来源与研究方法

      2.1 数据来源

      研究数据来源于百度地图迁徙。百度迁徙是基于定位服务(Location based service,LBS)技术,通过手机定位信息映射用户行为轨迹,塑造出人口流动过程中产生的起止城市、路径流强度,在数据精度上达到了个人层级,同时能够摒弃公路、铁路、航空等单一运输模式造成的数据片面性,为地理时空研究提供了实测流数据支撑[26-29]。研究对象为中国大陆4个直辖市及297个地级行政区,共301个空间对象。2015年中国春运官方定义周期为2月4日-3月16日,由于数据获取原因,研究时间为2015年2月7日-3月18日(下文春运期间均指这一时段),共计40 d。百度迁徙提供了一天内人口在各城市间省际流动的方向性与强度,为减少小概率事件对回归结果的影响,剔除研究期内总量低于10人次的人口流。处理后春运人口流动网络共包含19317条城市非对称流,承载人口流动强度7988.029万人次,占原始数据总量的97.7%。

相关文章: