简单、复杂与地理分布模型的选择

作 者:

作者简介:
陈彦光(1965-),男,河南罗山人,北京大学城市与环境学院博士,教授,主要从事城市和理论地理学研究,E-mail:chenyg@pku.edu.cn,北京 100871

原文出处:
地理科学进展

内容提要:

地理分布的数学建模是空间分析的基本途径之一,但空间维度建模素为科学研究的难题。由于数学新方法的发展和复杂性研究的兴起,地理空间建模的一些传统困难有望解决。本文通过两类地理分布的对比分析,论述地理建模的关键在于简单分布的特征尺度和复杂分布的标度。地理分布包括空间分布和规模分布,其本质均为概率分布和广义的数学空间分布,而概率分布可以分为简单分布和复杂分布。简单分布具有特征尺度,平均值有效,概率结构清楚;复杂分布没有特征尺度,平均值无效,概率结构不明确。对于简单分布,应该采用有尺度分布函数开展尺度分析;对于复杂分布,理当采用无尺度分布函数开展标度分析。分形几何学、异速生长理论和无尺度网络理论都是复杂系统分析的定量方法,这些方法的综合集成,可望为地理分布建模和地理系统的空间分析提供有效的数理工具。


期刊代号:K9
分类名称:地理
复印期号:2015 年 04 期

字号:

      修订日期:2015-02

      DOI:10.11820/dlkxjz.2015.03.007

      1 引言

      20世纪50-70年代,地理学界发生了著名的“计量革命”。从此,地理学从一个空间描述性的学科演变为空间分布的科学,地理研究方法也从单纯的定性分析转变为定性、定量相结合的分析方法。加拿大学者Burton(1963)曾经指出,在1960年代初,地理学的计量革命结束了,此后进入理论革命阶段。但是,地理学理论革命没有实现预期的目标。有人分不清计量化与理论化的区别,认为整个过程都是计量化,因此认为不存在什么“计量革命”,而是所谓“计量演化”。这类文字游戏姑且不论。问题在于,为什么地理学计量化之后的理论化不成功?为什么相当多的地理学家一度逐步放弃了地理学的数学工具?计量革命的原因在于地理学在美国的生存危机。由于计量革命(计量化)、GIS技术(信息化)乃至今天地学计算方法(计算化)的出现,欧美地理学得以继续发展(陈彦光等,2009)。然而,地理学的理论化依然障碍重重。根本的原因在于,人们对地理系统性质的错误认识与不适当的建模,导致解释和预测的失效。举例说来,城市系统原本是复杂系统(Allen,1997;Wilson,2000;Batty,2005;Portugali,2006),复杂系统服从幂律,或者局部尺度服从幂律(Buchanan,2000;Barabasi et al,2003;陈彦光,2008b),局部幂律意味着存在一个标度区(scaling range)。城市位序—规模分布的Zipf定律就是复杂性的一个标志(Bak,1996)。但是,为了分析方便,很多地理学家选择了对数正态分布函数。原因之一在于,对数正态分布简单,具有特征参数,容易从数学上解析。另一个典型的案例是城市人口密度分布。本来城市人口密度服从负指数模型,即所谓Clark(1951)定律。但是,Sherratt(1960)等人后来选择了正态分布函数,而Dacey(1970)等学者则罔顾数据拟合效果不佳的事实,支持正态分布模型的选择。理由也很简单,Dacey(1970)自述就是正态分布性质良好——要比指数分布容易处理。从数学性质看来,虽然指数分布不如幂律分布解析困难,但比正态分布分析难度要大(Goldenfeld et al,1999)。问题在于,分明是没有特征尺度的系统,地理学家却错误地当作有特征尺度的分布来建模,其解释和预测效果可想而知。建模的基本目的就是解释和预测。如果模型解释不符合实际,预测不准确,怎么能令人信服?有些模型虽然在实践中解释现象和预测趋势的效果较好,但理论理解却遇到了困难,如异速生长模型的标度指数,引力模型的距离指数等,基于欧氏几何学都无法理解。只有今天的分形几何学才能给出合理的解释。由于诸如此类的原因,那个时代的很多计量和理论地理学模型、方法慢慢地被放弃乃至淡忘了。多年之后,人们才开始反思并重新认识地理学的计量化和理论化的前因后果(Philo et al,1998)。

      科学研究的基本范式是数学理论和受控实验(Einstein,1953;Waldrop,1992;Bak,1996;Henry,2002)。数学描述是科学研究的开端,但单纯的描述是不够的。计量革命的结果之一是将地理学由单纯描述性的学科变成了空间分布的科学。然而,空间分布理论建模的基本问题却一直没有得到解决。数学被称为研究“数”与“形”的学科。数、形及其关系可以用于地理学的数字与形态、过程与格局以及空间与地方的分析。科学研究的高等数学方法包括所谓“老三高”(微积分、线性代数、概率论与统计学)和“新三高”(拓扑、泛函分析、抽象代数)。经验分析主要利用“老三高”,理论建设可能涉及“新三高”。无论运用何种数学工具,关键在于找到特征尺度,或者与特征尺度有关的参数(郝柏林,1986;Takayasu,1990;艾南山等,1999)。为了说明这个问题,有必要认识两种不同性质的系统和相应的概率分布。一种是简单系统,对应于有特征尺度的分布,叫做有尺度分布;另一种是复杂系统,对应于无特征尺度的分布,叫做无尺度分布。通过分布特征认识系统的性质,针对系统的性质选择不同的数学模型。看起来问题比较简单,然而具体操作却又十分困难。正因为如此,才有大量的学术意见分歧和争论。通过学术争论,问题逐步明朗起来。基于城市研究的多年心得,以及与国内外专家的相关讨论,本文探讨有关简单、复杂和分布模型的关键性的问题,以供从事地理系统数学建模和复杂性分析的同行参考。

      

      2 简单与复杂

      2.1 简单分布与复杂分布

      地理现象可以概括为分布问题,包括空间分布(如城市人口密度分布)和等级分布,后者包括规模分布(如城市位序—规模分布)。由于等级结构与网络结构的等价性(Batty et al,1994;Chen et al,2014),规模分布在广义上依然属于空间分布。只要解决了分布的数学建模问题,地理科学的理论化才可望找到关键的突破口。然而,由于地理分布的复杂性,不同性质的分布相互交织,相关分布模型的性质也没有有效澄清,地理理论建模的难题至今悬而未决。为了解释这个问题,首先必须区分两类不同性质的概率分布,据此了解不同性质的地理系统(表1)。认识地理分布特征与系统性质的关键概念在于“尺度”——尺度是认识地理学原理的核心概念之一(梁进社,2009)。

相关文章: