经济理论篇 在十六届五中全会上审议通过的“十一五”规划中,建设社会主义新农村成为了今后五年我国经济社会发展的重中之重。作为建设新农村的重要目的之一就是要稳步提高农民生活水平,通过工业反哺和城市反哺进一步加大投入力度,实现城乡统筹发展的良性互动,而新农村的意义正如温铁军所言“使得农民在新农村就能享受城里的一切”。而消费作为反映农民享受改革开放物质成果的重要指标,已经被学界借予了极大的重视。比起收入来,消费总量、消费结构都可以更直接地表征农民的生活现状。我国地大物博,各地区农民在收入、文化传统以及气候等客观条件上都存在巨大差异,所以运用因子分析、聚类分析等实证手段对于我们系统研究农民消费问题是非常必要的。 从已有的文献来看,该种实证手段已经得到了广泛的应用。柯健运用2002年数据研究了城市居民消费,孙艳玲则研究了农村居民的消费结构;葛虹、逄守艳和殷玲分别用2002年和2001年的数据对比研究的了城镇居民消费结构和农村居民消费结构的差异。当然以上文章在数据选取上多数集中在2002年以前。在实证方法上,多数学者分别采取了因子分析、聚类分析的方法,也有学者综合两种方法,例如孙艳玲利用因子分析结果再进行聚类分析,而葛虹则利用聚类的结果对不同区域进行因子分析,殷玲则根据GDP排名进行分类,再采取因子分析。不难发现综合多种方法对全国多层次的分区研究是实证研究的发展趋势。 本文应用《中国统计年鉴(2005)》中的2004年全国31个地区的农业消费结构的八项数据,即:食品、衣着、居住、家电设备及服务、医疗保健、交通和通讯、文教娱乐用品及服务和其他商品及服务,综合运用因子分析和聚类分析等统计方法,以及农民纯收入的地区排名进行比对分析。本文应用SAS9.1软件做实证分析,关于因子分析与聚类分析的具体数理过程、统计意义与程序编写请参见:《统计分析方法——SAS实例精选》。 本文分析步骤如下:首先选取2004年全国截面数据对于八项消费作因子分析,在提取两因子的情况下,得到全国31个地区的打分,按照得分排名,对比2004年农村居民家庭纯收入排名,表明全国各地区消费结构情况。再利用八项消费结构数据,对于31个地区做聚类分析,将各地区分为四个层次。比较该四个层次地区与东、中、西部地区的涵盖地区的异同。最后,把四个层次的地区与东、西、中部的地区分别做消费结构的因子分析,均提取三个因子,可以得到七种不同的因子结果,与全国的因子结果一起进行对于,得出结论。 一、实证分析简要过程及结果 首先计算《各地区农村居民家庭平均每人生活消费支出(2004年)》(见附表一)的消费结构数据,计算八项消费的相关系数阵与协方差阵(见附表二),可以发现各个数列间具有很强的相关性,相关系数最低的为0.5949,最高可达0.9634。基本上都在0.8以上,满足因子分析的条件。 在因子分析的结果中,各个因子的特征值、贡献率与累计贡献率(结果见附表三)为因子一的特征值为6.844,方差贡献率为85.55%,因子二特征值为0.5905,方差贡献率为7.55%,此时累计贡献率为92.94%。按照常规,特征值大于0.6的因子都应选取,而在0.6以下则一般不必选择,但是为了更好地解释原有信息,特把贡献率为2.24%的因子三也选入分析,使得累计贡献率达到95.58%。通过方差最大化旋转后的因子载荷矩阵(输出结果见附表四),判断变化趋势相近的消费项目。其结果显示,代表百分之八十以上信息的因子一主要包括:衣着、医疗、交通通讯与文教,而代表信息7%的因子二则主要涵盖了食品与其他商品和服务;住宅和家庭设备归入因子三中。计算各地区的因子得分,得分虽然没有绝对意义但是得分的相互对比将说明各个地区农民的消费结构的对比。因子一的前五名为:北京、浙江、上海、山西、天津。因子二的前五名为:福建、广东、山东、浙江、上海。因子三的前五名为:上海、广西、浙江、云南、重庆。包括因子命名等的综合结果如下(表1): 表1全国31地区消费结构因子分析结果 因子一85.55% 因子二7.55%因子三2.24% 消费种类 衣着、医疗、交通通 食品与其他商品和住宅和家电 讯与文教服务 因子得分位列前五 北京、浙江、上海、 福建、广东、山东、 上海、广西、浙江、 名地区山西、天津 浙江、上海 云南、重庆 因子命名 主要消费因子次要消费因子弱消费因子 各地区因子得分与排名,以及纯收入排名如下(表2): 表2各地区消费结构因子得分排名与收入排名 地区主要消费 次要消费 弱消费 因子一 因子二 因子三 纯收入 因子一因子二 因子三 排名 排名 排名 排名 北京3.708058 -0.31794 0.319551 15 9 2 天津0.867372 -0.65368 0.2447885 2411 4