面向语义搜索的语料库语境信息标注研究 杨丽姣/肖航 文章面向汉语(二语)教学领域,结合语境要素构成、相关语言信息的特征与抽取需求,提出对语句情感类别与评价态度、对答结构的语义功能以及语段话题内容三类信息进行标注,形成动态语料库语境信息标注体系。实际上,提到语境信息,人们还会联想到典型情景、文本语体、省略与指代等元素。这些元素与本研究讨论的要素有一定交叉性,其语言特征抽取不易,在动态语料库的标注工作中暂不作考虑。语料库的标注体系建设及基本标注任务完成后,课题组将面向语义搜索,抽取语言特征,开展计算机语境信息自动识别算法研究,并动态扩充语料。这样做的好处是,以话题标注为例,借助语料库话题标注及自动识别成果,一方面,教师、教材编写者以及研究人员能够在语料库中检索汉语(二语)教学的常见话题,统计话题频率、话题相关的高频词汇、关键表达式;另一方面,通过语料库的动态扩充以及热点话题的发现,从业者能够与时俱进,及时调整教学内容,更好地平衡教学中语言内容与语言形式的关系。除了语境信息标注研究,动态语料库建设工作中也开展了多义词词义标注、句法语义综合标注及自动识别算法研究,以期综合利用语料库多维语言信息,为推动数字化汉语教学、提升汉语(二语)教学信息化水平作进一步的尝试。 《语言文字应用》,2015.1.107~116 语料库40:多模态语料库建设及其应用 多模态语料库的建设及相应研究已成为语料库语言学的新起之秀,堪称语料库的40版。多模态语料库既符合一般语料库建设的整体规律,也具有自身的显著特征。它为语言学研究提供了新的视角和方法,能够拓展语言学研究范畴、发现新的规律,并上升至多模态语料库语言学的高度。本文在介绍现场即席话语、多模态语料库、多模态语料库语言学及其思想方法的基础上,对现场即席话语多模态语料库的语料采集、转写、切分、标注以及建库等若干共性问题进行探讨,分析尚存问题。展望基于多模态语料库开展的相关研究。 《解放军外国语学院学报》,2015.3.1~7,48 听说课不同偏误类型纠误方式比较研究 段轶娜/孙琪 对外汉语听说课堂话语实录语料库语料显示:留学生听说偏误分为语音、词汇、语法、语用四类。对初、中、高三级听说课教师纠误情况进行统计分析发现:(1)教师对不同语言水平留学生的纠误主要集中在语法和词汇偏误上。(2)教师对留学生语用偏误的纠误率与学生语言水平的提高成正比,而语音偏误则成反比。(3)教师对语音偏误的纠误手段较为单一,多使用重述手段;对语法偏误的纠误虽仍以重述为主,但方式趋于多样化;对词汇偏误的纠误多使用重述和重复手段;对语用偏误的纠误多使用重述手段和明确纠正手段。本文探讨了教师对不同偏误类型纠误的共性与差异的原因,并提出了教学中教师纠误方式的若干建议。 《汉语学习》,2015.3.89~95 汉语作为第二语言自然口语产出的复杂度、准确度和流利度研究 文章考察中高级水平的美国留学生汉语自然口语产出的复杂度、准确度和流利度特征的发展过程,并将汉语母语者的口语语料作为基线数据进行比较。研究发现,复杂度、准确度和流利度特征的发展有各自的特点,而且同一维度下不同特征的发展程度也存在差异。言语任务本身的认知要求在一定程度上制约了美国留学生口语复杂度、准确度和流利度的发展,导致一些特征较晚才能被习得。复杂度、准确度和流利度之间呈现出竞争和合作的关系。 《语言教学与研究》,2015.3.1~10 文章面向汉语(二语)教学领域,结合语境要素构成、相关语言信息的特征与抽取需求,提出对语句情感类别与评价态度、对答结构的语义功能以及语段话题内容三类信息进行标注,形成动态语料库语境信息标注体系。实际上,提到语境信息,人们还会联想到典型情景、文本语体、省略与指代等元素。这些元素与本研究讨论的要素有一定交叉性,其语言特征抽取不易,在动态语料库的标注工作中暂不作考虑。语料库的标注体系建设及基本标注任务完成后,课题组将面向语义搜索,抽取语言特征,开展计算机语境信息自动识别算法研究,并动态扩充语料。这样做的好处是,以话题标注为例,借助语料库话题标注及自动识别成果,一方面,教师、教材编写者以及研究人员能够在语料库中检索汉语(二语)教学的常见话题,统计话题频率、话题相关的高频词汇、关键表达式;另一方面,通过语料库的动态扩充以及热点话题的发现,从业者能够与时俱进,及时调整教学内容,更好地平衡教学中语言内容与语言形式的关系。除了语境信息标注研究,动态语料库建设工作中也开展了多义词词义标注、句法语义综合标注及自动识别算法研究,以期综合利用语料库多维语言信息,为推动数字化汉语教学、提升汉语(二语)教学信息化水平作进一步的尝试。 《语言文字应用》,2015.1.107~116 语料库40:多模态语料库建设及其应用 多模态语料库的建设及相应研究已成为语料库语言学的新起之秀,堪称语料库的40版。多模态语料库既符合一般语料库建设的整体规律,也具有自身的显著特征。它为语言学研究提供了新的视角和方法,能够拓展语言学研究范畴、发现新的规律,并上升至多模态语料库语言学的高度。本文在介绍现场即席话语、多模态语料库、多模态语料库语言学及其思想方法的基础上,对现场即席话语多模态语料库的语料采集、转写、切分、标注以及建库等若干共性问题进行探讨,分析尚存问题。展望基于多模态语料库开展的相关研究。