肌动理论和语言认知

作 者:

作者简介:
陈忠敏(1962-),男,上海人,美国加州大学伯克莱校区博士,复旦大学中文系教授,研究方向:实验语音学、历史语言学、汉语方言学(上海 200433)。

原文出处:
外国语

内容提要:

肌动理论(Motor theory)是关于语音感知的一种理论,它认为听者是根据自己的发音动作来匹配和感知外来语音的。这一理论刚提出就在学术界充满争议。本文利用脑科学和神经科学的最新研究成果来支持语音感知的肌动理论,并进一步说明:1)听者的语音感知机制和发音机制紧密相关;2)与其它非语音的声音感知不同,语音感知带有很强的主观性,而这种主观性受特定语言规则的制约;3)人类就是通过这种主观的语音感知来过滤各种语音变异,达到语言交际的目标;4)电脑语音识别必须转变思路,要充分考虑人类语音感知的特点,这样才能提高语音识别率。


期刊代号:H1
分类名称:语言文字学
复印期号:2015 年 06 期

字号:

      1.0 引言

      言语发声和言语理解是非常复杂的语言认知过程。从发音这个角度来讲,首先言语认知的高级中枢——大脑运动皮层要做出发音的运动规划,这一规划本身就是一个十分复杂的过程,要各相关系统的协调和参与才能做出发音动作的规划,然后规划进入执行过程,主要运动皮层(primary motor cortex)发出指令引起神经元(neuron)放电,生理电信号通过轴突(axon)和突触(synapse)传到下一个神经元,再牵动各种肌肉来驱动发音体及共鸣体改变,从而使得腔体内的空气粒子压力发生变化,传播到听者耳朵里,再由听者的大脑分析出接受的声音,产生我们能听到的语音。其中,说者发出的声音还要经过声波和躯体运动的反馈来做出适当的调节和矫正。根据Guenther[3]语言发音的DIVA(Directions Into Velocities of Articulation)模式,语音发音的流程如下页图1.01。

      言语发声既有前馈控制子系统(feedforward control subsystem)作用,也有反馈控制子系统(feedback control subsystem)作用。反馈控制子系统分声波(auditory)反馈和躯体感觉(somatosensory)反馈。人类首先在左脑说话的运动皮层(left frontal operculum)规划发音动作,这个发音动作的规划通过前馈子系统神经元牵动发音体肌肉,使发音体作出运动,随着共鸣腔大小形状的改变,腔体内气压也产生相应变化,产生声波;与此同时左脑说话的运动皮层也向大脑颞叶(temporal cortex)的听觉区和顶叶(parietal cortex)的躯体感觉区送出这个规划音的理想目标值(the ideal target)。经前馈子系统产生的语音会通过两种途径反馈给说话者,一种是声波,即声音通过空气粒子的振动传人自己的耳道,经过内耳再反馈到颞叶听觉皮层这一理想目标值投影区(auditory state map);另一种是发音时的躯体感受反馈,即声带振动、共鸣腔体的动作通过躯体感觉神经反馈到顶叶躯体感觉皮层中的这一理想目标值投影区(somatosensory state map)。如果反馈的信息跟理想目标值不同或有差异,就启动这两种反馈校对机制(auditory error map/somatosensory error map)对下一轮的发音作出修改,直至达到理想目标值为止。如果没有反馈,或者把反馈打乱,会直接导致发音者语无伦次。

      

      语音反馈刺激对语音发声具有的作用在聋哑人语言教学中得到充分体现。中国俗话有“十聋九哑”之说,就是说绝大多数耳聋的都是不能说话的哑巴。其实哑巴的发音器官没有任何缺陷,不会说话是因为耳聋,听不到语音,没有言语的刺激。19世纪中叶Alexander Melville Bell[1]了解到这一点,为聋哑人设计一套“可视语言”(Visible Speech),他根据发音的解剖生理构造把每个音(元音或辅音)画成可视的发音图,让聋哑人看图发音,可是Bell没有认识到语音反馈在语音发音中的重要性,所以这种对聋哑人的发音教学是失败的。即使是正常人,如果在没有言语环境中生长,过了言语习得的最佳时机(critical period/sensitive period),以后说话的能力就会大打折扣。道理很简单:因为听不见,所以说不出。可见,言语发声与言语感知有十分密切的关系。既然语言中说和听有这么密切的关系,那么,是不是可以反之亦然,即:因为说不出,所以听不见?这个命题使人想起语音感知的“肌动理论”(motor theories)。

      肌动理论的最早版本叫analysis-by-synthesis theory,上世纪50年代末由麻省理工学院著名教授Kenneth N.Stevens和Morris Halle[5]提出。他们认为听者是根据自己的发音来分析和感知外来的语音信号的。Haskins实验室的科学家Alvin M.Liberman等人[6]也在差不多的时间正式提出Motor theory这个名称,以后Liberman等人[7]对Motor theory又做了重大修改。基于语音感知和声学特征缺乏一致性(lack of invariance)、语音声学信号的不可切割性(nonsegmentability),以及语音传送信息的相对高效性(the relatively high efficiency of transmission of information),他们也认为听者“雇佣”自己声腔大小的信息以及自己的发音运动特性,直接对外来语音作出分析和解码。Stevens和Halle提出的analysis-by-synthesis theory和Liberman等人提出的Motor theory都强调听者是根据自己的发音动作来对外来语音解码和感知的。

相关文章: