党延忠
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:男
毕业院校:大连理工大学
学位:博士
所在单位:系统工程研究所
学科:管理科学与工程. 系统工程
电子邮箱:yzhdang@dlut.edu.cn
扫描关注
结合词性分析与串频统计的词语提取方法
点击次数:
论文类型:期刊论文
发表时间:2010-01-15
发表刊物:系统工程理论与实践
收录刊物:EI、PKU、ISTIC、CSCD、Scopus
卷号:30
期号:1
页面范围:105-111
ISSN号:1000-6788
关键字:文本自动处理;词语提取;原子词;合成词;词性标记
摘要:在介绍分析现有主要提词方法的基础上,提出并实现了一种结合词性分析与串频统计的词语提取方法.文章首先详细描述了该方法的原理与框架,同时结合实例说明了其实现过程.然后将该方法与已有的具代表性的文本提词方法作计算结果的对比分析,结果表明该方法能够提取得到电子文档中包括原子词与合成词在内的所有词语,并且准确率与召回率较之前的方法均有很大提高.优良的自动提词结果能够保证文本自动处理的性能,进而促进相关领域的自动化程度与性能的提高.