Current position: Home >> Scientific Research >> Paper Publications

基于字典匹配和支持向量机的中文科技论文元数据抽取

Release Time:2019-03-10  Hits:

Indexed by: Journal Article

Date of Publication: 2012-08-15

Journal: 工程数学学报

Included Journals: CSCD、ISTIC、PKU

Volume: 29

Issue: 4

Page Number: 586-592

ISSN: 1005-3085

Key Words: 元数据抽取;抽取模型;字典匹配;支持向量机;中文科技论文

Abstract: 针对中文PDF格式论文元数据抽取问题,对大量中文科技论文进行分析归纳,总结出中文论文元数据的互不包含性、排它性、重复性、顺序性和部分确定性,并据此定义简单元数据和复杂元数据的概念,应用字典匹配和支持向量机模型抽取中文科技论文元数据.实验结果表明,该模型的综合性能指标在96%以上,优于条件随机场模型和隐马尔科夫模型.

Prev One:PARTICLE SWARM OPTIMIZATION ON FLEXIBLE DOCKING

Next One:CoTrustWalker:一种基于项目和基于信任网络的推荐算法