location: Current position: Home >> Scientific Research >> Paper Publications

中文模糊限制语语料库的研究与构建

Hits:

Indexed by:期刊论文

Date of Publication:2015-11-15

Journal:中文信息学报

Included Journals:PKU、ISTIC、CSCD

Volume:29

Issue:6

Page Number:83-89

ISSN No.:1003-0077

Key Words:中文模糊限制语;分类;语料库;一致性分析

Abstract:模糊限制语常用来表示不确定性和可能性的含义,由模糊限制语所引导的信息为模糊限制信息.为进行中文事实信息的抽取,应将模糊限制信息与事实信息区分开来.然而中文模糊限制语语料资源却十分缺乏,影响了中文模糊限制语和模糊限制信息检测的研究.该文研究了中文模糊限制语的分类,并在生物医学和维基百科两个领域,设计构建了一个具有2.4万句规模的中文模糊限制语语料库.统计分析了语料标注的一致性,以及模糊限制语的类型和领域之间的关系.这些资源对于中文模糊限制信息检测研究,以及中文事实信息的抽取具有重要意义.同时,为语言学家从语义和语用等方面进行模糊限制语的研究提供了强大的知识库支持.

Pre One:Combining Feature-Based and Instance-Based Transfer Learning Approaches for Cross-Domain Hedge Detection with Multiple Sources

Next One:Co-training for detecting hedges and their scope in biomedical texts