大语言模型可信：内涵、影响、挑战与对策

引用| 收藏 |打印|下载word

作　　者：

钱明辉

作者简介：

钱明辉，中国人民大学信息资源管理学院副院长，教授，中国人民大学智能信息分析研究中心，博士，博士生导师；李胡蓉，中国人民大学信息资源管理学院，博士研究生；杨建梁（通讯作者），中国人民大学信息资源管理学院，中国人民大学数字人文研究院副教授，博士，E-mail：rucirmyang＠163.com（北京 100872）。

原文出处：

图书情报工作

内容提要：

[目的/意义]大语言模型可信能够确保模型在医疗、教育、法律等关键领域中可靠和安全地使用，并让公众对其信任，从而推动生成式人工智能技术的健康和可持续发展。[方法/过程]采用文献调研法对有关大语言模型可信相关研究展开分析，从大语言模型可信概念及内涵、大语言模型可信的影响因素、大语言模型可信面临的挑战及构建实现大语言模型可信的“TRUE”应对策略4个方面，对大语言模型可信进行全面分析。[结果/结论]大语言模型可信研究尚处于探索阶段，从内涵、影响、挑战等方面出发，搭建了信息技术、信息资源、信息用户和信息环境“TRUE”对策体系，以期推进大语言模型的善用，助力生成式人工智能向着更美好的方向发展。

期刊代号：G9

分类名称：图书馆学情报学

复印期号：2025 年 02 期

关键词：

大语言模型可信内涵影响挑战对策 Large language models trustworthiness Connotation Influence Challenge Trategy

字号：大中小

　　1 引言

　　2022年末以来，GPT-4、ERNIE和Llama2等大语言模型(large language models，LLM)备受关注，它们均是基于海量文本数据进行预训练的深度学习模型，展现出了强大的、更加泛化的语言理解和内容生成能力。以ChatGPT、文心一言、星火等为代表的接近人类水平的生成式人工智能应用被认为是人工智能领域从感知、理解世界到生成、创造世界的一次跃迁，作为新的生产力工具和创造力引擎，对社会和经济将产生深刻的影响[1]。这些生成式人工智能应用推出后已经被应用于金融、医学、教育、旅游、设计制造等诸多领域，几乎所有的学科都受到不同程度的影响。信息资源管理学科对于前沿信息技术的应用具有较强的敏感性，该领域的学者们较早地发现了LLM中蕴含的潜力和价值对学科发展所带来的影响[2-4]。如霍顿等[5]所言，信息资源管理本质上是基于信息资源的管理，而信息资源有广义和狭义之分，狭义的信息资源是指信息内容，广义的信息资源除了包括信息内容外，还包括与信息内容相关的技术、设备和资金。当下这个时代，LLM的核心要素包括算据、算法和算力，这实际对应了广义信息资源管理框架下的信息内容、信息技术和信息设备。因此，信息资源管理学科的发展为LLM的建构贡献了框架性理论基础，而LLM的应用则拓宽了信息资源管理对象的外延。

　　与此同时，全球各界对各类生成式人工智能应用的近忧远虑也日益增多。例如，美国的人工智能与数字政策中心(非营利性研究机构)于2023年3月在美国联邦贸易委员会提出投诉，申请对OpenAI进行调查，要求在建立相关的防护措施以前该公司不得再发布新的AI模型。中国、美国和欧盟等均对LLM引发的风险和挑战启动了监管规则的制定。基于LLM的生成式人工智能应用推出市场以来给人类社会带来了多方面的风险和挑战，包括将受版权保护的内容用作训练数据的合法性问题[6]、模型输出的知识产权保护与侵权问题[7-10]、训练数据和模型的输入输出所涉及的个人敏感信息问题[11]、借助生成式AI工具复制音频进行大范围和低成本的诈骗问题[12]、伪造高可信钓鱼邮件和发起社交网络攻击的问题[13-14]、输出错误的和不准确的结果对个人进行污蔑和诽谤的问题[15-16]、撰写的综述性内容看起来正常实则无可靠引用的问题[17]。由此可见，LLM的应用在知识产权、数据隐私、网络安全、模型可靠性和准确性等方面均引发了一系列问题和担忧。这一方面会降低人们对LLM本身和其输出结果的信任，并由此减少对LLM的使用；另一方面会引发一些前所未有的法律和道德风险，如应用输出的内容可能涉及违法、侵犯用户隐私等。

　　面对上述问题，学界也开展了一些探索性的研究，主要集中在以下两个方面：一是通过公开数据集或自建输入任务的方式对ChatGPT等应用进行测评，梳理其存在的不可信现象。如张华平等[18]使用9个数据集在4个任务上测评ChatGPT，发现其在情感分析上具有85％以上的准确率，在闭卷问答上出现事实性错误的概率较高。G.Marcus等[19]从公众那里搜集了有关ChatGPT出现过的错误，包括无法进行一位数的算术题、表现出性别歧视和种族主义偏见、无法弄清楚故事中事件的顺序等。A.Borji[20]通过问答形式对ChatGPT进行了测评，将ChatGPT出现的问题划分为推理错误、事实错误、偏见等11种类型，并分别对其形成的原因进行了分析。王超等[21]以国内某权威辟谣平台中与健康相关的信息为研究对象，使用ChatGPT和讯飞星火对其真实性进行鉴定，结果显示两个应用对个别信息的解释存在科学依据不够详细、逻辑错误等问题。朱禹等[22]基于AI事故数据库AIID，以生成式人工智能(Artificial Intelligence Generated Content，AIGC)相关的事故报道为样本进行内容分析，探索了AIGC事故的类型、原因、损害对象和应对措施。二是基于LLM在某一细分领域应用的技术性原理分析，揭示其存在的短板并提出应对策略。如刘明等[23]分析了LLM应用于教育领域的技术原理和优劣势，吴英华等[24]剖析了ChatGPT的技术原理和关键学习机制并对其优点和局限进行了总结，同时探索了ChatGPT在智慧医疗场景下的实施路径。郭亚军等[25]在总结ChatGPT的运行原理与技术优势的基础上，为ChatGPT赋能图书馆提供了实践路径。

　　综上所述，已有研究从不同角度探讨了涉及LLM可能存在的不可信问题，包括不可信现象的测评、不可信问题的类型列举、不可信问题带来的潜在风险等，但大多以单点个例的维度进行现象分类和原因分析，尚未构建起LLM不可信问题的系统性分析框架和体系化的解决方案。因此，本研究采用文献研究法对现有文献进行归纳，在厘清大语言模型可信内涵的基础上，全面分析了影响大语言模型可信的因素，并探讨了其面临的“四短”挑战，结合信息技术(information technology)、信息资源(information resources)、信息用户(information users)和信息环境(information environment)四要素来搭建实现大语言模型可信的“TRUE”对策体系，为解决大语言模型可信问题提供理论参考。

共17条结果上一页12 3 4 5 6 下一页全部展开

数据要素市场化推进力评价指标体系构建研究

刘越男

图书馆...2025年第02期
革故鼎新：中国国家安全情报理论研究的挑战...

安洪若

图书馆...2025年第02期
从图书馆视角看信息资源管理

赖茂生

图书馆...2025年第02期
开放科学环境下高效推进我国哲学社会科学预...

黄国彬

图书馆...2025年第02期
社会诉求数据赋能政务决策

张莉曼

图书馆...2025年第02期

大语言模型可信：内涵、影响、挑战与对策

相关文章：