语素的计量分析与识别方法

——以苗语语素分析识别为例

作 者:
黄行 

作者简介:
黄行 通信地址:100081 北京 中国社会科学院民族研究所

原文出处:
民族语文

内容提要:

本文通过词库中同音且同义或近义的音节之间的系联,在苗语88个亲属词的小样本中,根据基本语义或共同语义特征及其词频的分布,从合成词中识别和切分出大部分语素。分析结果还表明,语素在构词过程中会出现词义扩散现象。


期刊代号:H1
分类名称:语言文字学
复印期号:2001 年 04 期

关 键 词:

字号:

      苗语和汉语一样是单音节语素型语言,因此语素是一级基本的语言结构单位。单音节的表意汉字,记录的一般就是汉语的语素。对于没有文字,尤其是没有表意文字的苗语来说,合成词中的语素的识别和划分是有困难的。由于语料(注:语料取自中国社会科学院民族研究所语言研究室《苗语调查词汇资料》和《苗汉简明词典(川黔滇方言)》(贵州民族出版社,1958年),同时向李云兵同志对语料的核实表示感谢。是用国际音标注音、用汉语义释义的苗语词,所以若要分析和识别语素,必须通过同音且同义或近义的音节之间的系联的方法解决。系联方法之于手工操作是非常繁难的事情,但若用计算机程序操作却很方便。这个工作我们是这样通过程序进行的:(1 )首先从语料库中检索出所有单音节词,并给予一定的代码标记;(2 )用标记过的单音节词去搜索词库,给全部语词的每个音节加以下代码标记:能自由分布并且单独成词的音节标记代码2; 能自由分布但是和其他音节构成词的音节标记代码1,不能自由分布只和其他音节构成词的音节标记代码0;(3 )按单音节词排序生成新的语素库,并根据有无共同语义特征给语素释义或区分同音语素。

      一 用以识别划分语素的语料样本

      以苗瑶语词库中川黔滇苗语(以先进话为代表)语料库所收88个亲属称谓词为例,说明语素的分析和识别的计量方法。首先列出全部亲属称谓的语音形式、语素代码标记和相应的语义特征(见表1)。 因为语言不可能给每个词一个单独的语素形式,通过语素的复合来构词是汉藏语常用的比较经济的构词方法,因此这88个亲属称谓词多数是多音节和多语素的。从这些亲属称谓的词汇形式很难直观地看出构词语素的身份,只有通过程序对其中同音且同义或近义的音节之间的系联才可以做到。

      表1 川黔滇苗语的亲属称谓系统

      亲属关系 亲属词 语素类语义特征

      代码① 辈分② 男/女 血/姻亲 直/旁系 长/幼

      

      

      

      

      

      

      

相关文章: