那日萨

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:系统工程研究所

学科:管理科学与工程

联系方式:0411-84707385

电子邮箱:nmgnrs@dlut.edu.cn

扫描关注

论文成果

当前位置: 那日萨 >> 科学研究 >> 论文成果

基于互自扩展模式的中文产品属性提取算法

点击次数:

论文类型:期刊论文

发表时间:2016-06-22

发表刊物:计算机应用研究

收录刊物:CSCD

卷号:34

期号:4

页面范围:977-980

ISSN号:1001-3695

关键字:在线评论;产品属性提取;互自扩展;FP-Growth算法;置信度

摘要:针对中文在线评论中产品属性词的提取,提出了一种基于互自扩展模式的半监督学习方法.利用较少的人工参与,通过FP-Growth算法挖掘频繁项集获得种子属性词,通过增量迭代发现新的属性词;在每一轮迭代中,通过计算提取词与提取模式的置信度确保了算法的准确性,同时避免了主题偏移.最后通过相似提取模式获得复合提取词,大大减少了因分词及词性标注错误所导致的属性词挖掘错误,以牺牲较少准确率的代价换取了较高的召回率.实验结果表明,该算法对产品属性提取的F值可以达到78.97%,结果优于其他类似的提取算法.