数据时代与语言产业

作 者:

作者简介:
李宇明(1955-),男,河南泌阳人,首都师范大学文学院特聘教授,北京语言大学教授,博士生导师(北京 100089)。

原文出处:
山东师范大学学报:人文社会科学版

内容提要:

数据时代的标志是把数据看作生产要素,数据价值由科学领域进入社会经济制度领域。语言数据包括四类:语言的符号系统;语言负载的信息;由语言延伸的各种符号与代码;生活、艺术与科学技术符号。无论是从量上还是从质上看,语言数据都是最为重要的数据,因而也是重要的生产要素。包括语言数据产业在内的语言产业将成为数字经济的一方支柱。随着语言智能的发展,语言逐渐为人和机器两个“物种”所拥有;信息空间是人类正在建造的第三空间,随着信息空间、语言智能和物联网的发展,语言将承担起“万物关联对话”的任务,在社会、信息、物理三元空间中发挥互动作用。新基建应是“智能新基建”。语言学的研究对象应当是具有“双物种”属性、在三元空间运行的语言;要考虑用“新文科”的思路培养适应数据时代需求的语言人才。


期刊代号:H1
分类名称:语言文字学
复印期号:2021 年 03 期

字号:

      数据(data)是观察客观世界和人类社会得到的各种原始素材,通过对素材的加工处理获取信息、建构知识、生发思想。人类社会自形成以来就有数据存在,并为人类知识体系和思想观念的形成发展不断作出贡献。随着计算机的产生和发展,数据的作用更加重要,科学地位更加凸显,社会也对其更加重视。在计算机科学中,所有能输入计算机并被计算机程序处理的符号,都可称之为数据,包括数字、文字、符号、语音、图像、视频,等等。计算机所形成的网络,为社会构建了一个虚拟的网络空间;计算机在数据收集、处理上表现出强大功能,特别是通过大数据学习而不断挖掘知识、获取智能,促进人工智能的快速发展和广泛的社会应用,突出了数据的科学意义。2019年10月,党的十九届四中全会将数据与劳动、资本、土地、知识、技术、管理并列为第七大生产要素,作为生产要素的数据可以通过市场“按贡献取酬”。这是重大的理论创新,体现着对信息化社会的本质认识,也是社会进入“数据时代”的标志。本文讨论数据作为生产要素的意义、语言数据与生产要素的关系、语言智能与人类正在建造的“第三空间”、数据时代的语言产业问题等。目的在于认识语言数据在数字经济发展中的意义,语言学要以新文科的思路为数据时代培养人才。

      一、数据成为生产要素

      数据的价值首先被科学家所认识,特别是被计算机专家和信息专家所认识。计算机与信息科学是当今的先锋学科,对社会发展影响巨大,当今政府常会关注这类学科的发展动向,并及时利用公权力支持这些学科的发展,以便为本国的经济社会发展赢得机遇。因此,政府也会从这些学科领域认识到数据的价值,数据的意义由此从科技领域转入社会领域。

      政府对于数据的认识,可以分为两个层面:第一,推进科学技术发展;第二,推进经济社会发展。第一层认识的结果是加大科技投入,改进科技政策;第二层认识会在第一层认识和行动的基础上,进而改进经济发展政策和社会经济分配政策。政府的这两个认识层面,也代表着数据认识的两个阶段。当政府有了第二个层面的认识,看到数据的生产要素性质时,社会就进入了“数据时代”。

      (一)各国政府的“数据行动”

      在移动网络和人工智能快速发展的时代,各国政府都十分关注数据及其相关问题,积极采取一系列与数据相关的政府行动。有学者曾较为全面地介绍过这方面的情况①:

      2017年3月,英国发布《英国数字化战略》,提出要释放数据在英国经济中的重要力量,提高公众对数据使用的信心。2018年,英国又发布《数字宪章》《产业战略:人工智能领域行动》《国家计量战略实施计划》等。2018年,美国发布《数据科学战略计划》《美国国家网络战略》《美国先进制造业领导力战略》等;欧盟发布《欧盟人工智能战略》《通用数据保护条例》《非个人数据在欧盟境内自由流动框架条例》《促进人工智能在欧洲发展和应用的协调行动计划》等;法国发布《法国人工智能发展战略》《5G发展路线图》《利用数字技术促进工业转型的方案》等;德国发布《联邦政府人工智能战略要点》《人工智能德国制造》《高技术战略2025》等。

      2015年7月,印度提出“数字印度”倡议,计划以“印度制造”和“数字印度”两驾马车驮载国家未来。2017年7月,俄罗斯发布《俄罗斯联邦数字经济规划》。韩国早就提出要建设“数字政府”,要求管理网络化、办公自动化、政务公开化、运行程序优化,从而使政府决策科学化、社会治理精准化、公共服务高效化、政府治理民主化。2017年,韩国行政自治部和信息化振兴院共同发布《2017年电子政府10大技术趋势》,宣布将数字政府逐渐发展成为结合数据分析、机器人技术、提供更周到服务的“以数据为中心的政府”。2018年,日本发布《日本制造业白皮书》《综合创新战略》《集成创新战略》《第2期战略性创新推进计划(SIP)》等,详细阐述了推动数字科技和数字经济发展的行动方案。这些行动方案,充满着“数据、数字、智能”等字眼。

      (二)数据的生产要素属性的认识历程

      前述各国政府的“数据行动”,其认识基本上还都在推进科学技术发展的第一层面,但也开始触及推进经济社会发展的第二层面,但并未明确把数据列入生产要素。生产要素的认定,与生产力发展水平和经济制度密切相关,也与人们的思想认识水平相关。一方面,数据具有生产要素的性质,只有信息化发展到一定阶段才能成为现实,才能被人认识;另一方面,只有对信息化社会经济发展形态具有洞察力的社会集团,才能率先认识,及早布局。

      2017年12月8日,习近平同志在中共中央政治局第二次集体学习时提出:“要构建以数据为关键要素的数字经济。建设现代化经济体系离不开大数据发展和应用。我们要坚持以供给侧结构性改革为主线,加快发展数字经济,推动实体经济和数字经济融合发展,推动互联网、大数据、人工智能同实体经济深度融合,继续做好信息化和工业化深度融合这篇大文章,推动制造业加速向数字化、网络化、智能化发展。要深入实施工业互联网创新发展战略,系统推进工业互联网基础设施和数据资源管理体系建设,发挥数据的基础资源作用和创新引擎作用,加快形成以创新为主要引领和支撑的数字经济。”②这段话有两层意思:第一,数据是数字经济的关键要素;第二,如何发展数字经济。这些论述已经超越了为推进科学技术发展而关注数据,而是将数据问题向经济制度方向引领。

      2018年4月13日,“首届数字中国建设峰会”的数字经济分论坛在福州召开。2018年5月26-29日,中国国际大数据产业博览会在贵阳举行。2018年9月25日,江苏互联网大会在南京举行。2019年12月10日,第六届中国国际大数据大会在北京举行。这些会议都突出了“数据是数字经济的关键要素”这一话题。特别是2018江苏互联网大会,工业和信息化部总经济师王新哲到会致辞。王新哲在致辞中强调:“以数据作为关键生产要素的数字经济正在成为继农业经济、工业经济之后的新型经济形态。”至此,人们确认了两个基本认识:第一,数字经济是继农业经济、工业经济之后的新型经济形态;第二,数字经济的关键生产要素是数据。

相关文章: