人工智能大飞跃背景下的语言学理论思考

收藏 |打印|下载word |下载pdf

作者：

袁毓林

作者简介：

袁毓林，男，澳门大学人文学院中国语言文学系教授（澳门 999078），北京大学中文系/中国语言学研究中心/计算语言学教育部重点实验室，主要研究方向为理论语言学和汉语语言学，E-mail：yuanyl@pku.edu.cn（北京 100871）。

原文出处：

语言战略研究

内容提要：

当今以深度学习为核心的人工智能催生了科学研究的第五范式，本文呼吁，语言学研究也要拥抱数据/计算密集型的第四/五范式，并通过介绍和评论人工智能研究与技术开发过程中，有关专家对于跟语言学有关的问题的见解，来支持上述倡议。本文主张或赞成的主要观点为：（1）语言的主要功用是交际，思考往往是内心的对话与问答。（2）语言和思维并不完全等同，基于语言运用的智能水平的图灵测试并不完全有效。（3）语法这种智能并不是人类独有的，语法的原理还适用于语言之外的躯体、物品及其图像等组合性系统。（4）现有能力超强的大规模语言模型不能用作人与机器人交谈的技术界面，有效的语言运用必须是一种具身智能，包括具身认知的词语接地和环境可供性等内容；相应地，必须考虑不同类型的具身性图灵测试。（5）ChatGPT的成功说明了大模型、大数据和强算力能够捕获语言的统计规律和运用模式，语言学要采用数据/计算密集型的第四/五范式来探索语言的统计结构。

期刊代号：H1

分类名称：语言文字学

复印期号：2023 年 11 期

关键词：

深度学习人工智能第四五范式语言与思维（具身性）图灵测试　　deep learning artificial intelligence(AI) fourth fifth paradigm language and mind (embodied)Turing test

字号：大中小

一、引言：语言学研究要不要呼唤第四/五范式？

目前，以深度学习为技术核心的人工智能，已经对科学研究、技术创新和日常生活带来了颠覆性的影响。由于当今的人工智能技术可以在差异巨大的时间与空间尺度上，对自然现象和社会现象进行比较精准的建模与预测，比如著名的游戏程序AlphaGo能够打败人类围棋世界冠军，语言模型AlphaFold能够预测2万多种生物蛋白。因而，有人提出：这种人工智能技术与能力，是否代表着科学发现新范式的曙光？比如，图灵奖获得者、前微软技术院士吉姆·盖瑞（Jim Gary）用“四种范式”描述了科学发现的历史演变。第一范式的起源可以追溯到几千年前，它纯粹是经验性的，基于对自然现象的直接观察。虽然在这些观察中，有许多规律是显而易见的，但没有系统性的方法来捕获或表达这些规律。第二范式以自然理论模型为特征，例如17世纪的牛顿运动定律，或19世纪的麦克斯韦电动力学方程。这些方程由经验观察、归纳推导得出，可以推广到比直接观察更为广泛的情形。虽然这些方程可以在简单场景下解析求解，但直到20世纪，因为电子计算机的发展，它们才得以在更广泛的情形下求解，从而产生了基于数值计算的第三范式。21世纪初，计算再次改变了科学，这一次则是通过收集、存储和处理大量数据的能力，催生了数据密集型科学发现的第四范式。机器学习是第四范式中日益重要的组成部分，它能够对大规模实验科学数据进行建模和分析。这四种范式是相辅相成、并存不悖的。①

在此基础上，微软技术院士、微软研究院科学智能中心负责人克里斯·毕晓普（Chris Bishop）倡导科学发现的“第五范式”：把深度学习作为兼顾科学发现的速度与准确性的强大工具，用科学基本方程的数值解（而非经验观察）来训练神经网络；将科学方程的数值解看作自然界的模拟器，以较高的计算成本，对众多我们感兴趣的应用项目进行计算，例如预测天气、模拟星系碰撞、优化聚变反应堆设计，或计算候选药物分子与目标蛋白的结合自由能。②

如果简单类比一下，那么语言学研究的第一范式是基于经验的传统语法，第二范式是讲求操作程序的结构主义描写语言学，第三范式是探索结构模式及其背后心智过程的转换生成语法，以及基于认知科学的功能语言学。那么，在目前人工智能的自然语言处理领域捷报频传、模式锋出的今天，语言学界要不要呼唤和拥抱语言学研究的第四范式和第五范式呢？

为了更好地回答上述问题，我们首先需要了解目前人工智能研究与技术开发过程中，有关专家对于下列问题的见解：（1）语言与思维关系怎样？语言的主要功用是思考而不是交际吗？（2）从语言运用看智能水平的图灵测试有效吗？（3）语法这种智能是人类独有的吗？语法的原理只适用于语言吗？（4）现有的能力超强的大规模语言模型能否用作人与机器人交谈的技术界面？有效的语言运用为什么必须是一种具身智能？具身认知的词语接地和环境可供性为什么重要？相应地，为什么必须考虑具身性图灵测试？（5）ChatGPT的惊艳表现对语言学研究的范式选择有什么启发？

下面，我们分别对这些问题进行概述性介绍，也做出一些必要的评论；希望能够说明：语言学应该拥抱数据/计算密集型的第四/五范式，探索语言的显式的统计结构，为通用性人工智能的发展做出自己的贡献。

二、语言与思维的可分性和图灵测试的局限性

这一节首先介绍关于语言与思维关系的同一性假设及其反对意见，然后介绍乔姆斯基“语言的主要功用是思考而不是交际”的观点并提出质疑，接着通过介绍巴赫金的“对话”与“多声性”理论来说明思考与交际并不截然分开，最后介绍图灵测试所隐含的语言与思维等同假设和有关人工智能学者的批评意见。

2.1 “语言与思维的关系”是语言学理论的一个聚讼纷纭、长盛不衰的话题。其中，最有名的莫过于“萨丕尔-沃尔夫假设”。粗略地说，萨丕尔强调，需要注意语言如何将世界分割为不同类别方面的差异。他的学生沃尔夫则把上面这个见解扩充成著名的“语言决定论假设”③：

我们对自然进行划分，将其组织成概念，并根据我们的想法赋予其意义，这样做主要是因为我们就此达成了一致的协议——将它融入我们的语言，并编入语言的特定模式。当然，该协议是含蓄的、隐晦的，但其条款却带有绝对的强制性。

诸如此类的把语言等同于思维的学说，在哲学界也大有市场。比如，尼采曾经写道：“如果我们不愿借语言法则思维，我们就会停止思维。”更加有名的是维特根斯坦的断言：“我的语言的界限也即我的世界的界限。”在德里达等后现代主义大师们的作品中，也充斥着“摆脱语言的桎梏是不可能的”“文本就是自我参照”“文本之外一无所有”等危言耸听式的警句。④然而，正如平克（Pinker 2002）所指出的：

认为语言就是牢狱的看法实际上过高估计了语言本身的力量，从而贬低了语言主体的能力。语言是一种非常了不起的能力，我们运用它来从不同的人那里获取思想，还可以通过多种方式对它进行更改和选择，以促进思想的进步。然而语言不同于思维本身，也并非人类区别于动物的唯一标志。它并不是所有文化的基石，也并非一个不可逃离的牢狱。语言不是强制性的协议，更不是我们世界的极限，也并非影响我们想象内容的决定因素。（中译本第245页）

2.2 近年来，乔姆斯基提出“语言的主要功用是思考而不是交际”的观点。他20年前在跟一个生物学家对答的视频中说⑤：

关于语言的通常假设是，它的功能是促进交流。对的，这一点我从来没有相信过。……语言的典型使用是为了思考，而不是为了交流。几乎所有的语言使用，接近100%是内在的。从统计学上讲，语言的用途几乎都是内在的。……但压倒性的证据表明，内在思维正在为我们发挥着某种功能，规划，苦恼，或者用来做其他的事情，其中只有一小部分最终用来交流。……事实上，即使是外化的部分，沟通也只是一种非常奇怪的感觉。……你和某人站在公共汽车站，……所以你和他们谈论天气或棒球比赛，那不是交流。有时这也被称为寒暄。……这只是一种建立人际关系的社交方式，并不是传递信息或其他意义上的沟通。……有些外化的，在外化的部分中，很多只是寒暄的交流。

共13条结果上一页12 3 4 5 6 下一页全部展开

黎锦熙对汉语方言分区理论的重大贡献

乔全生

语言文...2021年第11期
比较修辞学再界定的三个维度　　

毛履鸣

语言文...2021年第11期
江苏方言和彝语方言的双及物结构地理类型格...

柳俊

语言文...2021年第11期
“连XP都/也VP”构式的历时扩展与省略

胡亚

语言文...2021年第11期
说“”　　

邓盾

语言文...2021年第11期

人工智能大飞跃背景下的语言学理论思考

相关文章：