Indexed by:期刊论文
Date of Publication:2009-01-01
Journal:情报学报
Included Journals:PKU、ISTIC、CSCD、CSSCI
Volume:28
Issue:3
Page Number:368-373
ISSN No.:1000-0135
Key Words:领域特征词;领域隶属度;长度优先切词
Abstract:本文提出领域特征词(Domain Feature,DF)的概念,将其定义为:描述领域的最恰当的词语.由一个领域中所有领域特征词组成的集合称为领域特征词集(Domain Feature Set,DFs).为提高领域特征词集提取的效率和结果的客观性,本文给出一种以人机交互方式从自然语言语料库中提取的方法.该方法综合了长度优先切词算法和领域隶属度分析算法,前者保证召回率,后者提高准确率.实验证明,给定合适前景语料与背景语料,该方法能够显著提高领域特征词集构建的性能.领域特征词及其提取方法可以广泛地应用于信息和情报处理领域.
Professor
Supervisor of Doctorate Candidates
Supervisor of Master's Candidates
Gender:Male
Alma Mater:大连理工大学
Degree:Doctoral Degree
School/Department:系统工程研究所
Discipline:Management Science and Engineering. Systems Engineering
Open time:..
The Last Update Time:..