王贤文
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:男
毕业院校:大连理工大学
学位:博士
所在单位:公共管理学院
学科:科学学与科技管理. 区域经济学
电子邮箱:xwang@dlut.edu.cn
扫描关注
论文成果
当前位置: 王贤文-大连理工大学 >> 科学研究 >> 论文成果基于TF/IDF多因素改进算法的知识单元抽取研究
点击次数:
论文类型:期刊论文
发表时间:2011-01-01
发表刊物:情报学报
收录刊物:PKU、ISTIC、CSSCI
卷号:10
期号:10
页面范围:1037-1043
ISSN号:1000-0135
关键字:知识计量;知识单元;知识单元抽取;TF/IDF
摘要:深入分析知识研究的基本知识单元,对知识单元的概念、特性、载体及抽取过程做详细阐述,提出知识计量研究中的知识单元的定义与特性,对知识单元的独立性、组合性、链接性、多维性、外显性、可测性进行详细说明.根据知识单元特性以及中文文献特点,提出一种基于词长和位置考虑的TF/IDF多因素改进算法,以<半导体光电>期刊1999~2006年数据为实例,对比分析了传统TF/IDF特征词抽取方法与改进后特征词抽取算法,分析结果表明,基于词长和位置的TF/IDF多因素改进算法显著提高了知识单元抽取效率和准确性.