侯海燕
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:女
毕业院校:大连理工大学
学位:博士
所在单位:公共管理学院
学科:科学学与科技管理
电子邮箱:houhaiyan@dlut.edu.cn
扫描关注
科技论文中学术信息的提取方法综述
点击次数:
论文类型:期刊论文
发表时间:2017-10-25
发表刊物:数字图书馆论坛
收录刊物:CSSCI扩展
期号:10
页面范围:39-47
ISSN号:1673-2286
关键字:学术信息;论文全文本;信息提取;机器学习
摘要:为更好地利用和挖掘学术论文文本,识别并提取学术论文中的学术信息已成为一种非常迫切的现实需求,在文本挖掘、信息检索、主题监测、信息计量学等领域都有广阔的应用前景.学术信息可以分为题录信息、章节信息、引文信息、引用信息和其他信息.本文综述了在PDF和HTML/XML两种不同格式的学术论文全文中,提取各类学术信息的主要方法,并指出这些方法主要面向的格式文本以及可用来提取的信息种类.最后,本文列出了提取学术信息的常用工具.