空间数据统计分析作为地理信息科学的核心,是地理学研究的重要方法。认识它的起源、发展背景和历程,有助于明晰和聚焦空间数据统计分析的研究方向,更好地为实际应用服务。 世界是物质的,物质总是存在于一定的空间中,空间把事物分隔又联系起来。无论是自然界还是人类社会,无论是微观粒子还是宏观宇宙,事物都在相应尺度上有其本身的空间结构以及与外界的联系途径。事物在时间和空间上的普遍规律是科学研究的目的之一。所以在数据分析中,空间是洞察数据,进而是揭示现实世界中事物或现象规律的一个重要视角,并且随着认知的深入,空间问题变得越来越重要。 在研究地理学中的方法和理论时,应从其产生的地理环境、社会经济背景和哲学与科学基础进行分析,才能收温故知新、预测方向之效[1]。所以,要了解空间数据统计分析,应当了解与其相关的发展历史与背景,以及不同阶段的代表性成果、人物和事件等,但系统总结空间数据统计分析的文献不多。下面以时间为主序,力图从宏观背景和微观具体两方面系统梳理空间数据统计分析思想与方法的渊源和发展脉络,并探索其发展趋势。 1 早期孕育 1.1 德国区位论 18世纪末19世纪初,德国依然是一个农业国家,而已经走上工业化道路的英法等国的农产品价格上涨,德国农场主通过与英国的农产品贸易而获利,于是德国农业开始向规模化、产业化过渡。德国经济学家冯·杜能(Johann von Thünen)研究了德国农业经营模式和产业化问题,于1826年写成《孤立国》[2],发现经济活动以城市为中心由内向外大致呈同心圆状分布,大致描述了城市周围农业生产中明显的空间分布特征,从而奠定农业区位论的基础。 19世纪末20世纪初,德国完成第一次产业革命后迅速成为第二次产业革命的策源地之一,经济活动和人口在空间上加速向大城市聚集。在此背景下,德国经济学家韦伯(Alfred Weber)于1909年创立了工业区位论,而地理学家克里斯塔勒(Walter Christaller)于1933年提出的中心地理论[3]首次把非生产性的服务业纳入经济活动中,系统探讨了城镇等级、规模及其空间分布模式。1940年,德国经济学家勒施(August L
sch)的《经济空间秩序》[4]把独立的农业区位论、工业区位论扩展为系统的空间经济理论,并对克里斯塔勒的中心地理论进行了扩展。这些著作日益意识到距离对空间行为的影响,经济学和社会科学以空间问题为核心的科学研究,已成为地理学家的范式[5]。 区位论思想通过经济、商业和工业地理学进入美国地理学界,在1950—1960年代被翻译成英文,并被很快接受和得到发展[6]。这期间,美国宾夕法尼亚大学的艾萨德(Walter Isard)和一些同事对经济学家不考虑空间维度的做法日益表示不满,进而想开创一门结合经济学和地理学的新学科[7],并在1956年出版的《区位与空间经济》[8]中将冯·杜能、韦伯、克里斯塔勒、勒施等的模型整合为一个统一框架,尝试建立涵盖空间中分布的所有经济活动的一般化理论,艾萨德也因此被誉为西方区域科学和现代空间经济学的创始人。区位论思想也被一位爱沙尼亚地理学家坎特传到瑞典,坎特的研究助手哈格斯特朗(T
rsten H
gerstrand)使用类似空间观点调研瑞典中部的创新扩散[9]。 1.2 空间数据统计分析的“星星之火” 早在计量革命以前,不同学科领域就有空间数据统计分析方法的思想和实践。 在英国,19世纪的工业革命时期发生了四次霍乱流行。1854年霍乱在伦敦第三次流行时,斯诺(John Snow)医生把伦敦SOHO地区的道路、十多个饮水井和六周内因感染霍乱而致死的每一位死者的居住位置等内容绘制在一张地图上[10],发现一个明显的空间特征:死者的居住地集中在布罗得街饮水井附近。政府随后关闭了该水井,本次霍乱流行结束。 在美国,1872年Hilgard计算了美国1840-1870年的人口重心,发现一直在西移[11]。1890年,Drude建议用样方分析方法描述植物在不同空间位置出现的频率[12]。1913年,Priestley发表了野外布置样方的详细方法[13]。1917年,Jefferson把英国的城市和煤矿绘制在一张图上,发现城市在空间上呈现聚集分布[14]。1926年,Lefever用标准差椭圆测度人口分布的空间离散度[15]。1937年,Wright用统计方法描述地理分布的中心趋势[26]。1942年,Blackman提出度量植物空间分布的“分散系数”方法[17]。1948年,莫兰(Patrick Moran)对连接数统计量进行研究[18]。但一些社会学者如Neprash[19]、Gehlke等[20]就已经注意到经典统计学不能不加鉴别地应用到空间数据中。