侯海燕

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:女

毕业院校:大连理工大学

学位:博士

所在单位:公共管理学院

学科:科学学与科技管理

电子邮箱:houhaiyan@dlut.edu.cn

扫描关注

论文成果

当前位置: 侯海燕中文主页 >> 科学研究 >> 论文成果

科技论文中学术信息的提取方法综述

点击次数:

论文类型:期刊论文

发表时间:2017-10-25

发表刊物:数字图书馆论坛

收录刊物:CSSCI扩展

期号:10

页面范围:39-47

ISSN号:1673-2286

关键字:学术信息;论文全文本;信息提取;机器学习

摘要:为更好地利用和挖掘学术论文文本,识别并提取学术论文中的学术信息已成为一种非常迫切的现实需求,在文本挖掘、信息检索、主题监测、信息计量学等领域都有广阔的应用前景.学术信息可以分为题录信息、章节信息、引文信息、引用信息和其他信息.本文综述了在PDF和HTML/XML两种不同格式的学术论文全文中,提取各类学术信息的主要方法,并指出这些方法主要面向的格式文本以及可用来提取的信息种类.最后,本文列出了提取学术信息的常用工具.