汉源日词是指在日语中来自汉语的词语,属于日语外来语的一种。汉源日词在中国和日本都是重要的研究对象,有利于厘清日语词汇的发展史和中日两国语言文化交流的历史。近年来,大陆学者在研究汉源日词时,多偏重于使用定性方法的研究(汪维辉,2009),如研究某个具体时代引入汉语的原因(蔡凤林,2016)、汉语词汇在引入日语后发生的字形、语义变化(史有为,2005)等。但是这些研究缺乏整体性和大数据量的支撑。特别是日语词到底在哪些时代从中国借用了多少词语,一直模糊不清。 为了提供资料作论据,我们利用了日本出版的《日本语源大辞典》一书,对当中所收录的6000多条词语进行标注及分类,针对以下三个问题进行了统计分析:(1)观察词典内词汇的时代分布状况;(2)统计词典内词条的汉字构成比例,以得出汉字在日语词汇中的地位;(3)通过日语词与汉语源词的意义相似度分析,进一步确定每个时代引进汉字词和自造日语词的情况。据此,我们对汉源日词的整体状况和历时演进情况进行描写和讨论。 一、汉源日词的研究现状 对汉源日词的研究属于外来语研究的一部分,有助于中日两国的历史语言文化交流,一直受到国内外学者的关注。新村出(1995)肯定了日语中汉源词存在的积极意义并指出:“即使在当代,汉源词也是形成新词汇和构词的重要数据和原料。”国内学者从不同的角度对汉语中日语借词进行研究。从历史角度来说,蔡凤林(2016)指出,中国历史对日本的记载最早是在《汉书·地理志》中,汉语带来的的影响主要是以中国文化的渗透为基底或先导。历史上汉语对日语的影响也是以中国儒释文化传入日本为重要前提,自538年佛教传入日本后迅速普及,为汉字在古代日本社会大显身手创造了优越条件。而潘钧(2000)尝试追溯日本辞书的发展历史,发现新代以前的日本辞书的编纂也是在中国辞书的影响下发展起来的。以完成于平安中期的《新撰字镜》为例,它是现存最早及初步具备了汉和辞典特征的重要辞典,所收录的词汇有大量的“国字”出现,反映了当时汉字在日语词汇中的地位。 在文字方面,史有为(2005)指出,日本所用汉字不但基本上来自汉语和中国汉字,而且从属于中国的传统汉字系统。可大略分为四部分:中国传统正体汉字、中国传统汉字的异体字、日本根据中国传统汉字或中国异体自行发展出的异体字、日本根据本国情况按照汉字六书原则自行创制的汉字。其中,前三者占日本汉字的97%以上。陈红(2002)指出,日语使用汉字的历史悠久且数量众多,日本学习研究社编写的《学研汉和大辞典》就收录了1.1万个汉字。飞田良文、菅原义三编著的《国字辞典》中收录了1553个日本人根据社会生活需要模仿汉字的造字规律而创制出来的“国字”。日语国字绝大多数是会意字,约占9成左右。汪维辉(2009)以日语中的汉语字词作例,探讨了日语中汉字借词的情况。分别是:借字借词保存古义;传入的多数是文化词,固有词一般不易更改;日语借词可反映汉语的基本词历史更替;以及保留古时字形。 在语音方面,李莉(1998)指出在日语中的汉语词(日本多称之为汉语)的概念是指过去由中国传入成了日本语的词语,以及被广泛使用后模仿汉语读音的词语。汉语词的意义一是由汉字组成,二是用汉语音读。对此,李无未(2005)也有提及日本的汉音是来自唐代的长安音的,与《切韵》音系有一些细微的差别,基本上可以认为《切韵》音系与日本的汉音语音册系是相等的。 日本也有不少汉语借词的研究。桃井惠一(2006)曾以《汉语外来词词典》为例,汉语的10272个外来词中只有861个(8.38%)是来自日本的,而在这些源自日本的词语中,由日本产生的有671个,剩下的190个皆是来自中国古籍,说明历史上汉字词对日语词汇的影响较大。铃木俊二(2005)研究了进入琉球方言的汉词主要是在14世纪左右因交易传入的,这些词包含了动植物、饮食、生活、艺术、文化等多方面。 综上所述,可见目前国内外对汉源日词已经有了较多研究,但在历时量化分析上仍有不足。为了进一步探究汉语对日词带来的影响,本文从各时代的日词产生情况来推断汉语对日语的影响过程。 二、语料来源和说明 为了了解历史上各时代的日词产生的数据,最好的办法就是利用大而全的日语历时语料库。然而这样的语料库的缺位,使得学者们暂时无法进行历时统计分析。本文退而求其次,依据日本出版的高质量历时语源词典——日本小学馆株式会社出版的《日本语源大词典》进行统计分析。该书一共收录6013个日语词及7067个义项,包含动植物、食物、服饰、道具、动词、形容词等多类型的词语,每一个词条都标有词性、词义、造词理据、最早出现的正式文献名称及出版年份,征引的文献多达850部,从古时的风土记至近代的作品,包括现代的部分辞典。这部词典的数据可信性及准确性较高,能够帮助我们对词汇最早出现的时间进行界定并进行历时分析。 为了便于量化分析,我们对该词典建立了电子数据库。首先,我们对词典内所有的词条进行了录入和信息标注。除了词典已有的词义、最早出现年代和词性外,人工补充标注了每个词条的最早出现年代对应的日本朝代,便于更直观地从历史朝代上进行分析。然后对每个词条进行汉字比例的标注,分成全汉字、半汉字和全假名三类。对与汉语的词义相似度标注分成全假名、完全相同、部分相同、完全不同和日语独有词五类。这样就形成了信息较为丰富的日语词汇语源数据库,每个词条的信息参见下页表1。在这个数据库的基础上,可以统计出词典内的所有词条的时代分布、汉字所占比重及与汉语词典的相似度等分布信息。然后进行汉源日词的资料分析,可以更客观地得到汉源日词的分布数据,同时也方便利用图表查看每个词条的时代、词性、汉字比例及与汉语词义相似度等。