中图分类号:P208 文献标识码:A 文章编号:1001- 8107(2002)03-0023-04 自从美国哈佛大学数学系教授B.B.Mandelbrot于20世纪70年代中期引入分形这一概念,分形几何学(Fractal geometry)已经发展成为科学的方法论——分形理论,且被誉为开创了20世纪数学重要阶段。现已被广泛应用于自然科学和社会科学的几乎所有领域,成为现今国际上许多学科的前沿研究课题之一。用分形理论来解释自然界中那些不规则、不稳定和具有高度复杂结构的现象,可以收到显著的效果。这些应用对于更好的了解自然现象及其内在的成因显得尤为必要。在国内,分形理论在地理学中的应用自20世纪90年代以来渐渐活跃起来,但就分形理论在地理学中的现有应用和研究现状而言,研究多集中于自然地理学和人文地理学方向,而在新兴的地理信息科学(Geographic Information Science,GIS)方面的应用则相对较少。现在地理信息科学的主要研究手段——地理信息系统尚停留在对空间数据的存储、查询、分析、显示、制图、制表的水平上,而在地理系统的数学建模方面还有很大的不足。这对地理信息科学的发展带来了新的挑战。分形理论在对地理信息的模拟上具有独特的方法,将给地理信息科学带来全新的描述方法和分析工具。因此,分形理论在地理信息科学的综合应用将为未来地理信息科学的发展提供基础。 1 分形理论的由来和分形的定义 1967年,Mandelbrot在国际权威杂志《科学》发表了一篇名为《英国海岸线有多长?》的论文标志着分形概念的产生[1]。在该论文里,Mandelbrot提出了一个令科学界人士感到惊异的结论:英国的海岸线长度是不确定的,具体长度依赖于测量时使用的尺度。由此可以看出海岸线的长度是一个依赖于测量尺度的变量,必须寻找能更好地表示海岸线弯曲特征的参量。正是由于解决了这个难题,分形理论才引起众多研究者的重视,并取得了长足的发展。1977年曼得布罗特的专著《分形:形态、机遇和维数》的正式出版,则标志着分形理论的正式奠定[2]。从此,一门新的数理工具——分形几何学逐步形成。目前,分形理论与各相关学科相结合后迅速发展,已经成为一门跨学科、非线性并且相当活跃的学科。分形理论的研究和应用已经深入到人类活动的方方面面,并取得了令人瞩目的成果。所谓分形(Fractal),原意为破碎和不规则,用来指那些与整体以某种方式相似的部分构成的一类形体。Mandelbrot认为分数维是贯穿分形理论的最基本总线,并给出分形的定义为[3]:“一个集合,如果其Hausdorff维(一种分数维)严格大于其拓扑维,则称该集合为分形集。”当然,从今天看来这种定义有不令人满意的地方,因为此定义排除了一些明显应为分形的集合。因此随着分形理论的成熟与发展,现在分形理论的研究者给出了较为全面而恰当的定义,该定义认为分形是具有下列性质的集[4]:1)具有精细结构,即在任意小的比例尺下,都可呈现出更加精致的细节;2)其不规则性在整体和局部均不能用传统的几何语言加以描述;3)具有某种自相似的形式,但不是完全数学意义上的自相似性,而是统计的自相似性,或是近似的自相似性;4)一般D[,f]>D[,t],即Hausdorff维严格大于拓扑维数;5)该集常可由极简单的方法来定义,可能由迭代产生;6)其大小不能用通常的测度(例如面积、长度、体积等)来量度。 描述分形的特征量是分形维数,简称分维(fractal dimension)。分维本身的重要性是不言而喻的,它是分形可以广泛应用于各学科领域的出发点。其中Hausdorff维是最古老的,也是最重要的一种维数,它对任何集都有定义。然而,这种维数在理论上的意义远大于实际应用。对于一个分形集合,计算其Hausdorff维数一般是相当困难的。 2 分形方法在地理信息科学研究中的应用 运用分形理论对地理科学中那些不规则、不稳定或具有高度复杂结构的现象进行解释说明取得了良好的效果。如在自然地理方面建立了分形地貌学,在人文地理方面我国学者陈彦光对城镇体系结构,城市引力模型等做了诸多的研究和探索,也取得了很好的效果。目前我国学者对分形理论在地理信息科学中的应用较少。Goodchild认为,地理信息科学主要是研究应用计算机技术对信息的处理、存储、提取,以及管理和分析过程中所提出的一系列基本理论问题和技术问题,如数据的获取和继承、分布式计算、地理信息的认知和表达、空间分析、地理信息基础设施建设、地理数据的不确定性及其对地理信息系统操作的影响、地理信息系统的社会实践等[5]。现在GIS的发展趋势可以分为智能化、网络化、可视化等,而分形理论在这几方面的应用价值是巨大的。因此,推动分形理论在地理信息科学中的应用将极大的促进我国在未来的几年内占领地理信息科学的制高点,并为生产实践服务。笔者认为下面几个分形理论的应用方向将是未来我国学者在地理信息科学研究应该引起重视的。 2.1 分形理论在地理数据挖掘与空间决策支持中的应用 全世界数据库中75%~80%的信息与地理空间位置有关,而空间信息的共同特征是其高度的复杂性,面对如此庞杂的结构化或半结构化信息,怎么样才能做出较满意的空间决策。对决策进行有效支持必须有赖于空间信息的挖掘。所谓数据挖掘,就是从数据库中抽取隐含的、以前未知的、具有潜在应用价值的信息的过程[6]。数据挖掘模式的种类包括回归模式、分类模式、聚类模式、关联模式和时间序列模式等。这里介绍应用分形理论对时间序列数据进行挖掘的方法。因为地理数据中有大量关于时间序列的数据,同时又与地理空间位置有关,这样就构成了时空信息模式。传统的分析方法有时域分析方法和频域分析方法。霍斯特(H·E·Hurst)发现时间序列记录的结果具有自仿射特征,从而创立了域重新标度分析方法R/S(Rescaled Range Analysis)。后来Mandelbrot等又在理论上对该方法进行补充和完善,其主要原理为:考虑一个时间序列{ξ(t)},t=1,2…,对于任意正整数τ≥1,定义均值序列