发声态研究的相关问题与VoiceSauce的使用

作者简介:
凌锋,上海大学,E-mail:lingfengsh@shu.edu.cn;史濛辉,莱顿大学,E-mail:m.shi@hum.leidenuniv.nl;袁丹,华东师范大学,E-mail:dyuan@hanyu.ecnu.edu.cn;沈瑞清,新加坡国立大学,E-mail:shenruiqings@hotmail.com。

原文出处:
方言

内容提要:

本文对发声态的一些相关问题进行了梳理,澄清了现存研究中的一些概念上的误解,并对发声态产生的空气动力条件进行了解释。此外,还介绍了与发声态相关的主要声学参数和一些相关研究。在此基础上,本文推荐使用目前国际上比较常用的发声态声学参数分析软件VoiceSauce,并详细介绍如何利用该软件进行发声态研究。


期刊代号:H1
分类名称:语言文字学
复印期号:2020 年 02 期

关 键 词:

字号:

      零 引言

      0.1 启动(initiation)、发声态(phonation)和调音(articulation)是语音三要素。其中启动指语音的气流来源和方向,发声态主要指喉部活动,调音指的是声道共鸣和发音特征。跨语言研究表明,不同的发声态在很多语言中都有音位价值(详细参见Gordon & Ladefoged 2001)。在国内学界,早期发声态研究主要集中于民族语中(如孔江平2001);近年来,随着汉语方言研究的不断深入,学者们也已逐渐关注发声态在汉语方言中所起的重要作用(如朱晓农2005,2009)。在汉语方言声调的研究中,即便不进行专门的发声态研究,也常会面临非常态发声带来无法正常提取基频值的问题,这说明了关注发声态的必要性。

      随着大家对发声态问题的重视,汉语方言的各种发声态也陆续被学者们发掘出来。目前汉语方言中比较常见的发声态主要包括:气声(如大部分北部吴语,参看Cao & Maddieson 1992;Ren 1992)、嘎裂声(如台州话,参看朱晓农2004)、假声(如岳阳话,参看彭建国和朱晓农2010)等。这些研究不光丰富了我们对汉语方言的认识,也有力地推动了世界语音学的进步。

      但是,总体来说,国内学界有关发声态的研究并不是很成熟。形成这一现状有多方面的原因。其中固然和缺少必要的实验设备有关,因为研究发声态最好使用专门的仪器(如电子喉头仪),但这些仪器往往售价昂贵且操作复杂。目前国内多数文科科研机构和院校并没有购置这类仪器。当然,即便不依赖这些仪器,单纯的声学分析也能提取很多发声态相关的参数。只是问题在于,现有常用的语音软件都不能直接提取发声态的相关声学参数。要测量这些参数,必须通过手工测量,或者编写脚本(如Praat脚本)的方式才能完成。这就给大多数研究者设立了比较高的技术门槛。再者,与发声态相关的参数非常多,并不能简单只用一两个参数就解决所有与发声态相关的问题。如何解读这些参数,对于非专业进行实验语音研究的研究者来说是一个很大的困难。如果不能真正理解这些参数的意义,很可能会造成误读。事实上,我们也看到,由于对发声态相关的基本概念及性质了解不够准确,现存的部分研究出现了一些误读参数的情况。

      0.2 为了降低发声态研究的门槛,方便研究者提取相关发声态声学特征,美国加州大学洛杉矶分校(UCLA)语言学系和电子工程学系合作开发了一款简单易用的软件VoiceSauce(Shue et at.2011)。VoiceSauce(后文简称为VS)是一个基于Matlab开发的声学分析软件,不但可以完成很多声学参数的测量,还可以分析Electroglottograph(EGG)结果文件,并把结果直接输出到EMU语音数据库(EMU Speech Database Management System)。同时,VS还能够自动完成批量参数提取。这对于想要进行发声态声学分析但没有编程基础的学者来说,无疑是个非常方便合用的工具。

      壹 发声态的声门姿态、空气动力条件和声音传播条件

      在目前国内涉及发声态的研究中,最容易出现的问题主要有两个:一是概念上把声门形态与发声态直接划等号;二是测量时只考虑最后的声学参数结果,直接把声学表现等同于对应的发声态。针对这两个误区,我们首先要明确的是,发声态概念中可以进一步区分出三个因素:声带的松紧开合、空气动力条件和声音传播条件。以下简单介绍这三个因素。

      1.1 声带的松紧开合与声门的控制机制有关(Laver 1980)。声门主要由两个部分构成,一是声带主体之间的“韧带声门”,二是后端勺状软骨之间的“软骨声门”。或分别称为“音声门”和“气声门”。勺状软骨可以控制韧带声门的开合,至少可以区分出三种开合状态,分别是:开、闭合、紧闭。而在韧带声门关闭的时候,软骨声门又可以单独控制开合,因此在之前韧带声门三种开合状态上,同时又分别可以与软骨声门开合两种状态配合,形成五种不同的整体声门开合状态。此外,声带的纵向松紧程度与音高的变化直接相关。一般来说,声带松弛,音高变低;声带紧张,音高变高。但声带在“纵向极度拉紧”状态时,其振动方式与其他情况完全不同,只有声带边缘参与振动,形成一种独特的假声发声态。因此声带的松紧开合其实可以分解成三个参数,分别是:韧带声门开合、软骨声门开合和纵向是否极度拉紧。

      1.2 空气动力条件主要指发声时通过声门的气流情况。声带要发出声音,不但需要声带自身的调节,还需要有气流通过,否则不可能产生声音。形成气流的必要条件是在声门上下维持一定的气压差。与发声态有关的声门压差有两个重要的临界值:一个是由层流变成紊流产生噪音的压差阈值;另一个是让声带振动起来的“发声阈压”(phonation threshold pressure,简称PTP。参看Titze 1988)。所以即便是相同的声门松紧开合状态,也会由于空气动力条件不同而实现为不同的发声态。这一点往往是有些研究者所忽略的。

      综合考虑声门松紧开合与空气动力条件,可形成如下页表1所归纳的不同发声态。表中清浊发声态大类分别用宋体和黑体来表示。

      

      不同学者对发声态的分类、定义和命名都不大一样。本小节只是简单介绍了学界相对达成共识的发声态分类。Catford(1977:93-116)、Laver(1980;19964:184-200)、Ladefoged和Maddieson(1996:47-77)以及朱晓农(2009)都对发声态有更细致的分类和论述。而要进一步了解发声态与喉部、咽部控制的复杂关系,可以参看Esling等(2019)。目前来看,除了常态浊声以外,最常见的发声态主要是气声(很多学者把呼气浊声和耳语浊声统一归为气声)和嘎裂声两种。

相关文章: