中图分类号:H116.4 文献标识码:A 文章编号:1000-1263(2001)03-0060-05 壹 问题的提出 二十世纪三十年代,赵元任先生首创了用“五度值”描写声调的方法。这种方法源于音乐理论,将一种声调语言的调域空间(基频的最大值与最小值之差就是调域空间)分为五个等份,由低到高依次为一度到五度。声调的五度表示法沿用至今功不可没,但是这种方法由于主要靠人耳的听力辨认声调,所以无法做到精确,分歧也就在所难免,例如汪平著的《苏州方言语音研究》(1996)一书认为苏州话阳去调是曲折形的,而叶祥苓和盛毓青编的《苏州话音档》(1996)却认为这个调是直线形的。 本文试图在语音实验的基础上,用数学分析的手段探索一种更有效、更科学的研究声调的方法。 贰 用CSL做声调实验 在做实验之前必不可少的工作就是设计调查字表、联系发音人以及实地录音,这里就不再赘述了。早期的声调实验采用波形分析法,其原理是通过信号的周期来推算频率,这种分析音高的方法需要繁杂的计算。后来,人们用语图仪分析声调,因为窄带语图能够显示出各种频率成分,所以只要找到基频就可以分析声调了,但是由于噪音的干扰或者是仪器分辨率的限制,很难得到某个音节精确的基频。现在,随着信号处理以及计算机技术的发展,语音实验设备不但功能越来越完善,而且操作越来越简单。我们使用的CSL4300B计算机语音实验设备包括语音信号输入和输出装置、语音信号处理装置以及应用软件。整个系统的使用方便、功能齐全,有信号导入、文件管理、图形与数据显示、语音输出、信号编辑以及多种信号分析功能。 实验步骤如下(详细情况请浏览我们的网站http://speechlab.top263.net/): 1) 启动设备,运行CSL程序 2) 打开三个窗口,窗口A显示时域波形,窗口B显示宽带语图,窗口C显示声调图 3) 设置运行参数 4) 将录制在磁带上的信号通过“线路输入”导入系统 5) 在窗口A中选定要处理的音节,在窗口B中用菜单命令显示宽带语图,在窗口C中用菜单命令显示声调图 6) 记录窗口B中显示的带声调部分的起止时刻 7) 将窗口C中的声调图信息保存在文件中 8) 重复步骤4、5、6、7,直到全部音节处理完成 叁 数据整理和归一化 用CSL做声调实验保存的数据文件有个文件头,接下来声调的频率值以一定的时间间隔出现。为了便捷地得到需要的数据,我们用C语言编写了一个应用程序将需要的数据提取出来,在提取数据的同时对数据进行整理。经过整理的数据是按照声调时长的百分比排列的。也就是取声调的起始点频率,然后每隔时长的10%时间段取一个频率值。为了说明这一步骤的合理性,我们假定一个调类的频率的标准解析表达式为(以直线调形为例) f(t)=kt+b (0≤t≤T) (1) T是平均调长,也就是这个声调实验样本调长的平均值。如果有两个样本w1、w2,则 f[,w1](t)=a[,w1](kt)+b (0≤t≤T[,w1]) (2) f[,w2](t)=a[,w2](kt)+b (0≤t≤T[,w2]) (3) 从公式(2)、(3)可以看出,系数a[,w1]和a[,w2]导致两个样本的时长改变,但是两个样本的“模式”没有改变。所以对同一个调类的不同样本来说,直接采用从CSL上保存的数据是不能进行比较的,必须将原始的等时间间隔数据转化为等时长比例数据。转化的方法是将调长等分为10份,这样共有11个时间点(包括起止点),每个时间点的频率值用CSL文件中该点前后两点的平均值。即
f[,n]表示经过整理得到的值,f[,m]是CSL记录下来的值,m与n之间的关系是T[,m]<T[,n]<T[,m+1]。 以上的步骤是对每一个样本进行的处理,一般来说每个调类有多个样本,最后还应该将这几个样本的每个百分时刻的值做平均,这样每个调类都有一组数据附图{f[,k]}(k=[1,10]),后续的处理和分析都是基于这几组平均值进行的。 由于人对声调的感知具有相对性,所以不需要研究具体的频率值,这就要对数据进行归一化处理。归一化的方法是对所有的数据做方差运算,得到一个值c,再取所有数据的平均数,得到一个值m,然后将每组数据中的每个数都做如下运算,即可得到归一化后的值,
这里以苏州话为例,苏州话有七个声调,通过上述的实验过程和数据处理,得到七组数据(对应七个声调),每一组是一个列向量,表1就是七组数据经过归一化后的结果,这七组数据的图像为附图1。 肆 用MATLAB做数据处理 MatLab是美国Math Works公司80年代中期推出的数学软件,其优秀的数值计算能力和卓越的数据可视化功能使之在众多的数学软件中脱颖而出。我们用MatLab所做的工作有两项,一项是用函数描写单字声调,另一项是对声调函数的分析。