Current position: Home >> Scientific Research >> Paper Publications

基于Bootstrapping的汉语词义消歧研究

Release Time:2019-03-10  Hits:

Indexed by: Conference Paper

Date of Publication: 2007-10-13

Page Number: 191-197

Key Words: 汉语词义消歧;贝叶斯分类器;Bootstrappig算法;分组策略;标注语料

Abstract: 提出一种基于Bootstrapping的汉语词义消歧模型。该模型采用贝叶斯分类器作为基本分类器,从小规模的词义标注语料出发,分类器通过对初始标注语料的学习来对未标语料判别义项,可信度高的句子加入标注语料集,这样不断提高分类器的性能,在选取可信度高的句子时采用分组策略。实验表明,在相同的标注语料条件下,采用原始策略和分组策略的Bootstrapping算法较基本贝叶斯算法都取得了更好的分类效果,分组策略Bootstrapping算法的消歧准确率比贝叶斯算法平均提高了3.5%。

Prev One:HMM and CRF Based Hybrid Model for Chinese Lexical Analysis

Next One:基于组合方法的组块识别