论点摘编

作 者:

作者简介:

原文出处:

内容提要:

06


期刊代号:H1
分类名称:语言文字学
复印期号:2024 年 05 期

关 键 词:

字号:

      人工智能的“理解”

      ——论语言的工具性与存在性

      王子威

      以ChatGPT为代表的大语言模型由于其在自然语言处理方面展现的强大能力而引起多方深切关注。人工智能能否“理解”自然语言以及这种“理解”与人类的理解有何不同?从这一问题出发,需要详解基于人工神经网络架构的大语言模型的语言处理技术过程,深入探寻人与语言的关系,揭示在人工智能将语言视为工具性数据和人类将语言视为存在性中介二者之间有着根本区别。语言作为工具所带来的客观性闭锁和语言作为存在所展开的生成性活力之间的区别决定着人工智能的“理解”和人类的理解完全不同。人工智能将语言视为工具性符号是基于科学的认识论而欠缺一定的时间和历史维度,对数理逻辑的依赖和与事物现实的割裂极易导向一种为适应标准化人工语言而损害创造性自然语言的技术异化。面对得益于巨大算力而飞速发展的人工智能,人类的出路是在安全利用工具的同时依然保有着对个体有限性的自觉,依靠语言和经验的连接,坚守理解和时间的统一,也正是在这种语言和理解的存在性中显现着一条可从容应对技术异化的路径。

      《东岳论丛》,2024.1.125~135

      我国低资源语言大规模数据建构及语言田野实践的数据转向

      范俊军 沐华

      低资源语言是指缺乏可用于自然语言处理任务和语言学计量分析所需足够基础数据的语言。低资源语言数据稀缺,是当前语言科学和自然语言处理共同面临的问题。语言数据资源最基础的部分是单语或双语词汇、语句的语音和文本数据。我国普通话、粤方言、藏语、维吾尔语、蒙古语、壮语总体属于高资源语言,其他语言都属于低资源语言,其中县乡语言和方言属零资源语言。建构我国低资源语言的大规模数据,有助于强化我们掌握自己国家语言资源的控制权,发挥我国自然语言处理领域在语言模型技术创新中的独特作用,推动语言田野工作的数据转向,创新田野语言学理论和实践,促进基于数据计量的语言学广域研究。建构我国低资源语言数据,主要有四项任务:一是建构大规模词语数据集,二是建构知识语义词网,三是建构大规模句子数据集,四是现有语言资料的数据化。

      《云南师范大学学报》(哲学社会科学版),2023.6.25~35

      大国语言战略:新时代外语教育的挑战与变革

      杨丹

      大国语言战略是国家战略的重要组成部分,是提升国家综合竞争力的重要因素,外语在其中扮演至关重要的角色。面对世界之变、时代之变、技术之变,本文结合经济学的分析框架,深入剖析我国外语教育面临的挑战与变革,提出五大建议:1)从需求侧考虑,必须推动外语教育从“为考而学”向“为用而学”转变;2)从供给侧视角,外语教育应从标准化培养模式向更加个性化和灵活的学习模式转变;3)从市场需求出发,外语教育需从单一的语言教育扩展至提供全面的语言服务;4)从战略层面,将语言教育作为提升国家软实力的重要手段;5)从大学使命出发,外语类高校需重新定义其战略价值,致力于培养具有家国情怀、全球视野、专业本领的复合型人才。文章最后介绍了北京外国语大学面向2050年的发展战略。该战略紧密贴合中国式现代化建设战略需求,以全球语言、全球文化、全球治理为三大战略支柱,建设致力于全球文明交流的世界一流大学。

      《外语教学与研究》,2024.1.3~11

相关文章: