Indexed by:期刊论文
Date of Publication:2010-01-15
Journal:系统工程理论与实践
Included Journals:EI、PKU、ISTIC、CSCD、Scopus
Volume:30
Issue:1
Page Number:105-111
ISSN No.:1000-6788
Key Words:文本自动处理;词语提取;原子词;合成词;词性标记
Abstract:在介绍分析现有主要提词方法的基础上,提出并实现了一种结合词性分析与串频统计的词语提取方法.文章首先详细描述了该方法的原理与框架,同时结合实例说明了其实现过程.然后将该方法与已有的具代表性的文本提词方法作计算结果的对比分析,结果表明该方法能够提取得到电子文档中包括原子词与合成词在内的所有词语,并且准确率与召回率较之前的方法均有很大提高.优良的自动提词结果能够保证文本自动处理的性能,进而促进相关领域的自动化程度与性能的提高.
Professor
Supervisor of Doctorate Candidates
Supervisor of Master's Candidates
Gender:Male
Alma Mater:大连理工大学
Degree:Doctoral Degree
School/Department:系统工程研究所
Discipline:Management Science and Engineering. Systems Engineering
Open time:..
The Last Update Time:..