大数据时代与经济史计量研究

作 者:

作者简介:
陈争平,山东大学经济研究院教授,清华大学人文学院教授。济南 250100 北京 100084

原文出处:
中国经济史研究

内容提要:

经济史计量分析大致有统计学、计量经济学、计量史学三大类方法。大数据时代来临,让我们更清楚地看到了样本无法揭示的细节信息,以统计为基础的经济史计量研究比小数据样本加数量模型更有效,统计学派更加贴近大数据时代的主要特点,更符合时代要求。我们现在进行数据库建设,既要注意数量,使得规模尽可能大;又要抓好质量,要建设经得起检验的数据库。经济史计量研究也可以帮助创立经济学的新的论点。


期刊代号:F7
分类名称:经济史
复印期号:2017 年 01 期

字号:

      目前世界上正在开启的大数据时代,正在升温的量化历史研究都与近代中国经济数据库建设有着密切的关系,本文就此做些探讨。

      一、为何要抛弃“计量史学”?

      近年来国内关于量化历史(Quantitative History)的研究正在升温,著名经济学家陈志武先生主办了四届“量化历史讲习班”以培养从事量化历史研究的青年学人,《中国经济史研究》则开辟有关专栏,努力推动这方面的研究。笔者在20世纪80年代初攻读硕士研究生时受吴承明先生启发,对计量史学(Cliometrics)做过一些探讨,后来在清华大学任教时也开设了《历史统计与计量史学》的研究生课程。那么,20世纪80年代开始在国内流行的“计量史学”与近年来国内流行的“量化历史”有何区别?笔者曾就这个问题请教李伯重教授。李伯重教授对国外学术动态有较多了解,他认为“计量史学”与“量化历史”就是一回事。笔者后来又进一步对Cliometrics与Quantitative History的定义及发展历程等进行检索,发现二者确实是一回事。

      从名称上看,Cliometrics比Quantitative History更简洁更有学术性。那么,近年来推动量化历史研究的一些学者为何要抛弃Cliometrics这一名称而宁愿采用Quantitative History?联系到吴承明先生指出计量史学“只曾盛行于美国。在欧洲虽有短暂反应,但不成气候”,“在中国则无响应”,而在美国“进入21世纪,计量史学已消失生气”。①想来由于计量史学发展业绩不好,名声坏了,所以后来那些学者宁愿抛弃“计量史学”而改用“量化历史”(Quantitative History)这一名称。

      总结以往计量史学发展业绩差的原因,对于更好地开展经济史计量研究有重要意义。笔者在清华大学为《历史统计与计量史学》备课时,曾经对以往计量史学发展业绩差的原因做过一些分析,可概括为以下四个方面。

      第一个方面是以往一些计量史学方法的倡导者过分夸大了历史数据的客观性及代表性。细考中国历史上一些数据来源,往往会发现它们来自于某个官员或士子的估算,后来又有一些研究者再根据这些估算作进一步推论,使得结论的主观性更强,客观性更低。一些中国近代农史研究者推崇民初卜凯的调查,实际上这一调查在地区的选择、指标的规定等方面都有较大主观性。②卜凯所用调查人员多是年轻学生,他们一般出生于富足人家,所以才能上大学,回乡调查也多是问自家长辈和管家等,有关数据就会偏向富人,对于当时农村总体而言代表性较差。卜凯的著作中提到的贵州遵义平均单位面积产量,大大高于另一外国教授(M.N.Jen)在实地调查中得到的数字。该教授认为,造成这种较大差异的原因在于,卜凯的著作仅以优质土地为样本,而实际上这种土地在遵义的耕地中只占非常小的比例。③

      第二个方面是夸大计量方法的作用,甚至断言用计量方法就能把历史学变成真正的科学。这种夸大不但不能提高真正的业绩,还会引起其他史学家的反感,导致计量史学一再遭遇质疑和批评,一些计量史学倡导者热情冷却后又回归传统叙事方法。笔者认为,计量方法只是史学走向科学的必要条件,而不是充要条件。把必要条件当做充要条件,就会使人狭隘,所得出的研究成果也会有偏差。计量方法仅是众多研究方法中的一种。正如吴承明先生所言:“研究经济史应根据不同对象和史料条件,采取不同方法。”④史学研究还是要走定性分析与定量分析相结合之路。

      第三个方面是各种数量模型的应用都有各自的前提条件,以往一些计量史学研究不论时空差异,盲目套用模型,以致扭曲历史真相,甚至会得出一些荒谬结论。当然,也并非任何模型都不能用,要视具体情况作具体分析。

      第四个方面是历史数据缺失,使得计量分析面临极大的史料困难。吴承明先生认为,在计量方法中,必须有连续十年的系列数据才能建立一个模型。在中国,这种连续十年的系列历史数据严重缺失,以致在20世纪八九十年代国内那些计量史学的鼓吹者自己也始终停留在鼓吹阶段,没有做出什么业绩,身体力行的只有吴承明先生。

      既然“量化历史”原本是改名换姓的“计量史学”,那么导致以往计量史学发展业绩差的四个方面的问题,值得现在从事量化历史研究的学者们警惕。

      二、大数据时代来临

      近年来国内关于量化历史研究正在升温时,恰遇一个新时代来临。英国学者维克托·迈尔-舍恩伯格、肯尼思·库克耶在《大数据时代:生活、工作与思维的大变革》一书中宣告:大数据时代来临。⑤

      随着计算机技术全面融入社会生活,信息爆炸已经积累到了开始引发变革的程度。在云计算技术推动下,一个大规模生产、分享和应用数据的时代正在开启。大数据很可能成为发达国家在下一轮全球化竞争中的利器,而发展中国家依然处于被动依附的状态。大数据建设在加强国家治理能力、国际竞争力等方面将发挥日益重要的作用。现代历史上的历次技术革命,中国均是学习者。而在这次大数据新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能。只要我们以开放的心态、创新的勇气拥抱大数据时代,就一定会抓住历史赋予中国创新的机会。⑥

      大数据时代的精髓与三个重大的思维转变有关,这三个转变是相互联系和相互作用的,这些转变将改变我们理解和组建社会的方法。

      第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。生活中真正有趣的事情经常藏匿在细节之中,而采样分析法却无法捕捉到这些细节。与局限在小数据范围相比,使用一切数据为我们带来了更高的精确性,也让我们看到了一些以前无法发现的细节——大数据让我们更清楚地看到了样本无法揭示的细节信息。⑦

相关文章: