现代汉语虚词的研究历史悠久,成果丰富。但是目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于NLP的相关研究。广义虚词知识库的构建是一个任重而道远的工作。目前的研究工作已经完成了包括词、介词、连词、助词、语气词、方位词等虚词用法词典属性的设计及填写工作,并进行相应虚词用法规则的形式化描述及部分语料虚词用法的自动标注,形成了初步的现代虚词法词典、虚词用法规则库及小规模的虚词用法语料库等“三位一体”的现代汉语广义虚词识库,下一步将针对其中的一些问题进行广义虚词知识库的精雕细琢,提高虚词用法自动注的准确率;同时,继续推进现代汉语广义虚词用法词典、虚词用法规则库及虚词用法语库等虚词知识库诸方面的协调进展,逐步构建准确完备的面向NLP的现代汉语广义虚词识库,为中文文本的机器理解提供可靠的数据基础。