标题:
中文专利属性值对抽取技术及应用
点击次数:
论文类型:
期刊论文
发表刊物:
计算机工程与科学
收录刊物:
PKU、ISTIC、CSCD
卷号:
38
期号:
4
页面范围:
800-806
ISSN号:
1007-130X
关键字:
属性抽取;属性值抽取;中文专利;条件随机场
摘要:
专利信息抽取是专利分析的基础,属性及属性值的识别与抽取是专利信息抽取所要解决的关键问题.目前,在中文专利信息抽取领域针对属性和属性值同步抽取的研究较少.本文以中文专利摘要作为实验语料,运用统计学习知识,提出一种基于条件随机场的抽取方法.该方法将属性和属性值视为命名实体,利用语料训练得到条件随机场模型,从而实现对属性和属性值的抽取;再利用挖掘的关联规则完成属性与属性值匹配.实验结果的准确率、召回率和F值分别是80.8%、81.2%和81.0%,其表明该方法能够高效同步抽取属性和属性值.同时,在抽取结果的基础上,本文完成了对专利的分析和同类专利的比较,体现了本方法的实用价值.
发表时间:
2016-04-15