深度学习,已成热词,并为人熟知。但熟知非真知。熟知上升至真知,必须“超越‘名称’式的把握,而达到‘概念’式的理解”。[1]“概念是人类认知思维体系中最基本的单位……学术研究很重要的一个方面就是概念分析,只有概念分析工作做扎实了,后面的论证才有意义。”[2]究竟如何理解深度学习?在纷繁复杂的表象背后,深度学习概念的演进有没有呈现出一些共识?要想稳妥而有力地回答这些问题,需要走进历史深处探察具体沿革,开启共时视野加以整体观照,进而面向未来发展提出具有前瞻性和全局性的建议。本文基于历史维度、共时维度和未来维度相结合的分析框架,尝试从学理上厘清深度学习的概念,以期深化相应的理解,为当前教育领域如火如荼的深度学习改革实践提供一定的参考。 一、在历史沿革中辨识 “与自然现象相比,文化现象更为明显地受到生成的制约。它们无论何时都不可能游离于过程的溪流。”[3]因此,需要“把所有单纯的事实都归溯到它们的生成,把所有的结果都归溯到过程,把所有静态的事物或制度都归溯到它们的创造性活力”[4]。深度学习这一概念,在生成发展的历史中获得并确证自身存在的合理性。 (一)萌芽阶段(20世纪70年代初至中期) 学界一般认为,马飞龙(Marton,F.)①等人于1976年在《英国教育心理学杂志》发表的《论学习之质的差异:I-结果和过程》[5]一文中最早提出深度学习概念。但该文用的是“深度加工”(deep-level processing),并未用“深度学习”一词。该文呈现了两项研究。第一项研究是40名学生阅读著作的部分章节,分别在阅读完成时和约六周半后根据所读内容回答相同问题;第二项研究是30名学生阅读文章,分别在阅读完成时和约五周后概述文章内容,研究者还让学生反思自己是怎样学习这篇文章的,并将学生的反思情况划分为不同的加工水平。研究发现,学生学习的过程和结果存在质的差异:进行浅层(surface-level)加工的学生,关注文本本身,或多或少地使用机械记忆策略;进行深度加工的学生,关注文本想要表达什么,即领会作者的观点。 文献检索表明,马飞龙不是在1976年首次使用深度加工一词,早在1974年他已开始使用这一术语,指出如果满足一些前提条件,诱导深度加工是改善学习的唯一途径。[6]往前追溯,1972年就有学者用“深度”(depth)描述认知加工水平,用“加工的深度”说明越有深度的分析越能充分利用规则和先备知识,越能带来更精细、更持久的记忆。[7]马飞龙虽未在1976年的论文中使用深度学习一词,但他用“浅层加工”和“深度加工”两个概念来归纳发现,开启了端绪,引发了后续的深度学习研究。 (二)成型阶段(20世纪70年代末至90年代末) 20世纪70年代末,为了让概念用词更为准确,有学者提出用“深度学习方式”(deep approach to learning)替代“深度加工”。学习包括意图、过程和结果,马飞龙对深度加工的描述同时涉及意图和过程,用“方式”一词兼顾意图和过程,更为恰当。[8]马飞龙也表示用“加工”一词描述学习的差异过于狭隘,认可“深度学习方式”这一用法。[9]自此,深度学习概念正式产生,越来越多学者对其展开研究,"deep learning"这种更简洁的表达也沿用开来。 这一时期的代表性研究成果如下。恩特威斯尔(Entwistle,N.)团队探明,选择深度学习方式的学生会运用理解、建构关联、使用证据和检查论证等学习策略,属于意义取向,源于内部学习动机;采用浅层学习方式的学生属于复制取向,源于外部学习动机,以完成作业或考试为目的。[10]比格斯(Biggs,J.B.)团队分析了促进学生深度学习的因素,包括适当的动机背景、高质量的学习活动、学生同伴间和师生间的高度互动以及良构的知识基础等。[11]帕斯克(Pask,G.)团队发现,深度学习者有整体论者(holist)和序列论者(serialist)之分,前者追求对不同事物及其相互关系的整体性理解,后者喜欢针对单个主题循序渐进地学习。[12] (三)发展阶段(21世纪初至今) 深度学习概念产生之后,虽陆续有相关成果发表,但深度学习能一跃成为研究热点,与深度学习在人工智能领域取得非凡成就带来的轰动效应密切相关。深度学习主要在人工智能的分支之一机器学习领域得到运用。机器学习是指“从有限的观测数据中学习(或‘猜测’)出具有一般性的规律,并利用这些规律对未知数据进行预测的方法”。[13]机器学习与人的决策有相似之处。人从已有经验中归纳规律用于帮助未来的决策,机器则是通过数据处理提取规律得出模型,并运用于新的认知场景。机器学习也分浅层学习和深度学习。浅层学习不涉及特征学习,由人工提取特征供给机器。深度学习致力于让机器自动提取特征。机器要能逐步提取底层特征、中层特征和高层特征,就必须构建具有一定“深度”的模型。为此,就需要一种学习方法从数据中学习一个“深度模型”,这就是深度学习。[14] 深度学习中的深度模型,主要是一种人工神经网络,[15]是受人脑神经系统工作方式启发而构造出来的数学模型,包括一个输入层、多个隐藏层和一个输出层,以便逐层自动提取特征。人脑神经系统是一个由生物神经元组成的高度复杂网络,能将声音和视觉等信号经过多层编码,从最原始的底层特征开始不断加工、抽象,最终得到更抽象的语义表示。[16]比如,在视觉皮层内部,神经元按多层结构排列,感官信息在皮层间层层传递,对世界的表征越来越抽象。[17]人工智能领域深度学习的实质就是依据人脑对信息的多层处理模式,采用海量数据进行逐层训练,让人工神经网络中的每一层都提取一些新的特征,原始的信息通过逐层传递与转换,成为更抽象的表示,以便对事物进行区分,从而进行模式识别等。深度模型的层数即深度学习的深度。目前,模型深度已从早期的几层增加到十几层甚至上百层。