刘宇

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:西安交通大学

学位:博士

所在单位:软件学院、国际信息与软件学院

学科:软件工程. 计算机软件与理论

联系方式:18910567100

电子邮箱:yuliu@dlut.edu.cn

扫描关注

论文成果

当前位置: 刘宇 >> 科学研究 >> 论文成果

基于字典匹配和支持向量机的中文科技论文元数据抽取

点击次数:

论文类型:期刊论文

发表时间:2012-08-15

发表刊物:工程数学学报

收录刊物:PKU、ISTIC、CSCD

卷号:29

期号:4

页面范围:586-592

ISSN号:1005-3085

关键字:元数据抽取;抽取模型;字典匹配;支持向量机;中文科技论文

摘要:针对中文PDF格式论文元数据抽取问题,对大量中文科技论文进行分析归纳,总结出中文论文元数据的互不包含性、排它性、重复性、顺序性和部分确定性,并据此定义简单元数据和复杂元数据的概念,应用字典匹配和支持向量机模型抽取中文科技论文元数据.实验结果表明,该模型的综合性能指标在96%以上,优于条件随机场模型和隐马尔科夫模型.