中图分类号:K902,F590 文献标识码:A 文章编号:1000-0690(2011)07-0885-06 修订日期:2011-04-07 近年来,人类社会经济活动已经由传统地理空间延伸到了网络空间,网站信息流渐成为国内外学者关注的热点。国外研究主要集中在两方面:一是从理论角度探讨网站对访问者的吸引效用[1]、引导作用[2,3]及其对信息流影响[4,5];二是直接针对网站信息流距离衰减,开展了传输规律及其影响因素[6]、地方性[7]、空间关系[8]以及点击流数据聚类新模型[9]的研究。国外的研究普遍表现出创新研究的视角,提出了较为实用的方法,呈现出虚拟和现实两种距离衰减效应的结合。国内针对网络空间信息流的研究也取得一定进展,多从实证视角分析虚拟信息流传输的影响因素[10,11]、距离衰减形态[12]及方法论[13,14]等,为进一步探讨虚拟信息流距离衰减奠定了基础。 网站作为网络信息流传输的重要节点[15],其访问量可以直接反映网络服务器信息流的传输状况[16],旅游网站信息流量数据具有更大的公开性和资源共享性。本文将其做为研究对象,根据网站资料的获取情况,选取了24个旅游网站作为样本。研究中采用了旅游网站自建站以来至数据采集日期(2007年9-10月)这一时间段内,以省为单位的访问者信息流量数据。 本文首先运用Origin软件曲线拟合功能评估了24个旅游网站信息流距离衰减的一般形态,在此基础上逐级递进分别应用Zipf定律、地理集中度指数和指数模型三种方法,描述空间分布的集中性、揭示距离衰减的集中性程度、讨论距离衰减的本地集中性与指数模型符合性的关系。这项研究既为网站应用效果的评估提供新的理论依据和方法论,也为区域旅游目标市场确定和旅游网站自身功能完善提供理论支持。 1 基于Zipf定律所表达的空间分布集中性 1.1 Zipf定律验证 Zipf定律作为描述位序-规模分布的经验公式,与分形理论相结合后,被广泛地应用到城市[17,18]等研究领域,文中采用由“假设”到“验证”的逆向研究范式,对旅游网站访问量位序-规模分布形态进行描述。假设各旅游网站访问量的位序-规模分布符合Zipf定律,对其进行检验。在进行检验之前将24个网站分为两类,第一类是首位省份(即旅游网站访问量最高的省份)在旅游网站所在省,共17个;第二类是首位省份不在旅游网站所在省,共7个。根据24个旅游网站分省访问量对31个省份进行规模排序,将点列[K,f(K)]数据标绘在双对数坐标图上,即可绘制出旅游网站访问量的位序-规模分布曲线,得到判定系数
(表1)。24个旅游网站的判定系数
均大于0.6,说明旅游网站访问量位序-规模分布均服从Zipf定律,旅游网站信息流的规模分布形态对首位省份的区位敏感度低。
1.2 无标度区范围 无标度区是指分形关系成立的尺度范围,可以表明研究对象具有某种分形特征,是统计分形中的一个重要的界定。本文采用人工判别法对无标度区分段和无标度区范围进行确定,即根据双对数点图确定一段线性关系最好的区间为无标度区间,再用最小二乘法进行线性拟合,确定无标度区分段和无标度区范围(表1)。从表1可看出,24个旅游网站均存在明显的无标度区,且具有两个特点:其一,多数旅游网站的无标度区范围均包括大部分数据点;其二,多数旅游网站仅出现一个无标度区,说明旅游网站位序—访问量规模分布结构整体上具有单分形特征。 1.3 分维值与集中性关系的论证 引入Pareto分布来说明每个旅游网站访问量在31个省份的分布集中性。利用Zipf参数和判定系数计算旅游网站分维值D[19](表1),定量描述旅游网站访问量分布的集散程度。比较表1中各维数q和分维值D可见,大多数单一无标度区范围的旅游网站Zipf维数均大于1,分维值均小于1,在0.189~0.817间波动,表明其规模等级结构均呈Pareto分布模式[20,21],无标度区内旅游网站访问量规模分布均比较分散,访问量空间分布呈不均衡状态,首位省份的垄断地位较强。将无标度区范围相近(数据点超过15个)、具有单分形特征的旅游网站按D值进行纵向对比发现:D值最大的西藏拉萨旅游网,其访问量规模分布比较集中,空间分布呈相对明显的均衡状态,首位省份的垄断地位较低,其访问量比重为14.4%;D值最小的喀什旅游网,其访问量规模分布比较分散,空间分布呈相对明显的不均衡状态,首位省份的垄断地位较强,其访问量比重高达66.5%。可见,D值越大,则访问量的规模分布越集中,规模分布的差异性越小,空间分布越均衡。上述旅游网站访问量空间分布的集散性特征映射出旅游网站所在地国内潜在旅游客源空间分布的集散性特征。 2 基于地理集中度指数所表达的本地集中性与经济集中性 文中采用区位商、空间洛伦茨曲线和基尼系数三个地理集中度指数衡量旅游网站信息流距离衰减集中程度[22]。 2.1 区位商的比较 按照各省省会与旅游网站所在省省会的实际距离的升序对各省份进行赋值“31、30、29……2、1”作为各省份的赋值距离,然后根据
分别为各省份的赋值距离占赋值距离总和的比重和各省份对某旅游网站的访问量占总访问量的比重),计算旅游网站距离衰减的区位商值。将各旅游网站区位商值大于1的省份汇总,发现:①24个网站中11个网站的区位商最高值出现在网站所在省,说明旅游网站信息流距离衰减具有明显的本地集中性。②24个网站中区位商排在前5位的省份存在明显的重叠现象,除网站所在省以外,广东出现频率为95.83%(23次),且有5次位居第一,上海出现频率为66.67%(16次),北京出现频率为54.17%(13次);区位商值大于1的省份也存在明显的重叠现象,主要有广东、北京、上海和浙江。可见,信息流距离衰减过程中在经济发达地区访问量会高于按距离衰减应达到的水平,说明旅游网站信息流不完全按照距离均等的方式衰减,而是具有明显的经济集中性。上述本地集中性和经济集中性特征映射出旅游目的地潜在旅游客流的流量和流向特征,因此,中国旅游目的地的国内旅游目标市场应该定位于本地和经济发达地区。