普通话两字组的音量比分析

作 者:

作者简介:
梁磊,石锋,南开大学汉语言文化学院(天津 300071)。

原文出处:
南开语言学刊

内容提要:

本文利用幅度积和音量比这两个参数,对单独发音的普通话两字组的轻重问题进行了探讨。结果发现,两字组后字为非轻声的音量比平均值为1.05,表明其前后字的幅度积基本相等,后字稍大,可以认为等重;轻声两字组中,前字为阴平、阳平和去声时,后字轻声的幅度积远小于前字,而前字为上声时,前后字的幅度积基本相等,后字稍重,表明音高和音强/音量有高相关度。相对化的音量比概念可以很好地解释轻重音问题。


期刊代号:H1
分类名称:语言文字学
复印期号:2011 年 07 期

关 键 词:

字号:

      一 引言

      汉语这种典型的声调语言,关于其词重音各个方面的讨论已经有很多了。有的学者认为汉语没有词重音,而近些年来越来越多的学者认为汉语有词重音。在对汉语普通话重音的语音学研究中,林茂灿等(1984)对带正常重音的两字组的声学分析表明,普通话两字组的正常重音在声学上的表现是具有较长的时长和较完整的音高模式。陈肖霞(2002)发现,重读音节常常伴随着频谱高频部分的音强增加,即所谓的频谱倾斜,而在低频部分,音强的作用是可以忽略不计的。仲晓波等(2002)的研究显示,普通话词重音的声学相关物至少包括时长、音高、频谱倾斜和音强这四个参数。汉语轻声语音性质的研究与此情况相似,对于各个声学参量的相互关系以及它们作用力的大小,学者们进行了很多探讨,但尚未达成共识。

      从语音学的角度说,重音节与非重音节在许多方面表现不同,如更大、更长的发音动作,不易协同发音,更长的时长,更大的强度和响度,元音空间的扩展以及音高变化的出现。(Van Heuven & Sluijter,1996)下文我们从新的角度,运用新的方法对普通话后字为轻声和非轻声两字组的语音表现重新进行了探讨,提出了幅度积和音量比的概念,以期对汉语轻重音声学性质的讨论提供新的思路。

      二 幅度积与音量比

      (一)语音信号数字化

      语音是典型的模拟、连续信号,计算机要对它进行处理,必须将它转换成为数字声音信号,即用二进制数字的编码形式来表示我们听到的声音。最基本的声音信号数字化方法是采样一量化法。采样(sampling),即在特定的时间段内对连续变化的模拟信号进行不断地测量。采样得到的信号实质上就是连续变化的幅度值中的一个值,再用数字表示这个幅度值,那么所得到的信号就是数字信号。这里还需要解释一个相关概念,即采样频率(Sampling Frequency),是指在1秒钟内对声音信号的采样次数。比如我们语音研究中常用的11025Hz采样率的声音就是要用11025个数据(采样点)来描述1秒钟的声音波形。采样频率越高,声音的还原就越真实、越自然。

      (二)幅度积和音量比

      我们看到的语音软件中的波形图就是由各个采样点相连得到的。各采样点的绝对值对应于波形图的振幅。每个声音样本若用目前语音学研究中最常用的16位(16bit)表示,则其取值范围是0~65536,请见图1。

      

      图1 语音数字化波形示意图

      那么,某段语音的平均振幅可以由下面的计算得到:

      某段语音的平均振幅=各采样点绝对值之和/(采样率×时长)

      (注:时长为所选段的语音时长,单位为“秒”)

      公式中的“采样率×时长”表示的就是所选语音段内采样点的个数。我们这里引入一个新的语音参数——幅度积。所谓幅度积,即所选音段内各采样点幅度的总和,综合考虑了幅度和音长两个语音参数。计算公式表示为:

      某段语音的幅度积=平均振幅×时长

      (注:时长为所选段的语音时长,单位为“秒”)

      综合以上两个公式,也可以说一段语音的幅度积是由所选语音段每个采样点的绝对值之和除以采样率得到的,这样,幅度积就把采样率的因素排除了。但是,每个采样点的绝对值之和这一项本身是隐含时长因素的,因为采样点越多,则表明时长越长。而波形的幅度,决定了语音的音强。因此我们可以说,幅度积只和所选语音段的强度和时长成正比。

      但是,采样点的值是由很多因素决定的,如发音人声音本身的强弱、发音人离麦克风的远近、录音设备的增益等设置情况。进而,我们提出音量比的概念,即:一个两字组的两个音节之间幅度积的比值,我们称其为E值。具体算法为:

      音量比(E值)=后字幅度积/前字幅度积

      这样,我们就把受多因素影响的幅度积转化为具有可比性、相对化的音量比。下面报告我们对普通话两字组进行的音量比分析。

      三 实验过程

      (一)发音人

      实验所分析语料来自四位发音人。两位为天津电视台的播音员,两位是南开大学中文系的学生。这四人都能说标准的普通话。下文分别用M1(男播音员)、F1(女播音员)、M2(男学生)、F2(女学生)依次代表以上四位发音人。

      (二)实验材料

      普通话所有可能的声调组合形成的两字组对子,即其中一个两字组包含轻声,另一个为两个正常音节。两个两字组除了唯一的轻声/非轻声音节区别外,其他特征全部相同,比如说普通话中的“包含/包涵”这样的组合。

      (三)录音和分析软件

      录音是在南开大学中文系语音实验室中,将发音人所发的实验语料通过麦克风直接录入电脑,保存为分析软件中wav格式的数字声音文件,采样频率12800Hz。每位发音人的三遍发音被录音并用于分析和数据统计。

      我们的实验分析采用南开大学中文系与计算机系的专家合作开发的语音分析软件“桌上语音工作室专业版”(Mini Speech Lab)。

      (四)实验项目

      对两字组中的轻声音节及其前字进行测量和统计。重点在于分析轻声音节和非轻声音节的幅度积。幅度积与音长的数据从软件波形图窗口可同时测量得到,图示如下:

相关文章: