一、引言 生成式人工智能(Generative Artificial Transformer,GAT)的问世以颠覆性技术姿态敲开教育研究的大门。人工智能的地位已突破了传统的工具属性,转而成为引领未来教育发展的关键内生力量(眭依凡,等,2023)。因而,GPT应然出现与教育相互促进和发展的局面,而并非简单地体现其工具价值(Rospigliosi,2023)。然而,当前大量教育研究依然强调人工智能的工具性,并试图通过微调模型参数、改变训练数据集以试图适应教育等垂直领域的应用,始终突破不了生成式模型知识迁移能力和认知教育能力弱的瓶颈。如,钟秉林等(2023)认为ChatGPT等生成式模型与生俱来地与教育求真、求实底色不相符,将可能出现事实性、逻辑性乃至偏见性错误。因此,如何突破现有生成式模型刻板训练的思维框架,促进教育与人工智能技术双向发展成为亟待破解的难题。 今年,图灵奖得主、Meta AI首席科学家杨立昆(Yann LeCun)尖锐指出ChatGPT低学习、无认知的局限性,直言其应用寿命极短。他强调,从生成式模型跨越到世界模型(World Model)是未来人机交互的必然趋势。同时,国内相关研究也在反思如何扭转因教育话语权缺失所造成的人工智能教育应用的割裂感(刘凯,2023)。本研究目的在于从生成式模型迈向世界模型的角度探讨教育反哺人工智能的合理性及发展趋势,以优化当前人工智能与教育应用的兼容问题,为培育新的人机交互环境,赋能未来人才培养提供方向。 二、应用与反思 (一)生成式模型的教育应用 以机器学习、深度学习和强化学习为代表的人工智能促进了“从数据中产生知识”的可行性,极大提升了教育质量和公平(Zhai,et al.,2021),但以监督学习和全链路为主的训练路径直接或间接增加了教育应用的不可解释性,从而弱化了教育实践场景的应用效率。ChatGPT等生成式模型“从数据到学习再到知识”,以自监督学习为训练路径保持了自身一定的学习力,因而对教育有更大的颠覆价值(祝智庭,等,2023)。通过文献综述,本研究总结了当前的生成式模型对教育领域的主要两点贡献: 其一,推动素质教育落实。素质教育落实是创新型人才培育的关键所在。相较于传统人工智能,生成式模型基于大量语料训练催生“智慧”,以类脑神经网络的方式获得内容生成、序列任务执行和情景对话等智能能力(卢宇,等,2023),助力学习者从“检索—学习”模式转化为“对话—学习”模式,模拟苏格拉底产婆术的启发式对话彰显其培养学生省思的潜力(张敬威,2023),为摆脱应试灌输、推动素质教育提供可行之路。例如,ChatGPT结合数字人技术诞生个性化的虚拟教师,创新了传统翻转课堂模式,即“课前人机合作预习—课中人人交互讨论—课后人机合作巩固”的新型学习模式(翟雪松,等,2023)。在如今知识普遍外包的教育生态里,生成式模型一定的学习能力保证了学习者在主动精神、创新能力以及社会责任等素养教育新赛道上有所获得,相对地摆脱了应试教育的束缚,彰显了我国在迈向教育强国过程中所应具有的人才素养教育观念。 其二,促进教育公平。教育公平是精神共富的重要内容,是中国式现代化的重要特征。生成式模型提供了更为高效的个性化教育,降低了教育获得门槛,因而促进了校际和县域教育公平(于浩,2023)。主要表现在:第一,通过自然对话理解,GPT可迅速帮助学习者靶向整理在线教育资源,提高校际不同学生自适应学习的可得性和准确性(Tack,etal.,2022;王佑镁,等,2023)。第二,通过调用GPT开放接口,教育者将GPT包装为学生私人助手以获得更个性化的指导,弥补乡村优质师资缺乏问题。第三,结合元宇宙构建新型人机交互学习模式。在Web3.0以语义技术为支撑的时代,教育元宇宙是未来教育生态中赋能城乡教育共同体的重要技术手段(翟雪松,等,2022a)。在该场域下,生成式模型嫁接在元宇宙空间中,将突破传统以机为媒的人人交互,形成大规模“人人交互”与“人机交互”共生场景,对增强学生间的协作探究学习,缩小数字鸿沟具有积极的现实意义(李艳,等,2022)。 (二)生成式模型的教育反思 生成式模型强对话性、效率性和公平性的特点满足了师生解决具象化任务的需求,然而由于生成式模型在文本理解和视觉感知上存在明显瓶颈,因此难以给予更大的认知和教育支持。通过文献综述,本研究发现生成式模型天然的技术缺陷主要包括两个方面: 一方面,在文本理解上,生成式模型遵循意义匹配的生成法则,用于推算最优概率生成相关文本。换言之,生成式模型本身并不理解所生成文本的教育含义,对内容的真实性和偏见性自然无法判断。即使是斯坦福大学和谷歌公司基于GPT-3.5turbo联合搭建的沙盘世界(Sandbox)中智能体貌似自主交互的行为,其本质仍是基于概率做出的动作反应(Park,et al.,2023)。智能体涌现出复杂社会行为的背后,源自先前自监督的学习概率集合,智能体本身不具备智能产生的条件,无法形成自我认知。具体到教育这一垂直领域上,无认知的生成式模型难以完成“立德”等高阶教育任务。 另一方面,在视觉感知上,生成式模型的一般逻辑是基于大量预训练图集,以逐帧猜测的方式生成丢失或掩盖的图像。然而,这种生成方式是有损的,无法完全复刻训练图集的图像准确性。正是由于生成图像“有损”的弊端,放大了生成式模型无法区分关键和次要信息的局限,容易忽略或混淆核心内容的抽象表征,从而导致生成内容的不稳定性(Kim,et al.,2023)。反映在教育研究上,生成式模型对抽象表征力的缺失使其难以满足教育准确性和针对性的必然需求。