的个人主页 http://faculty.dlut.edu.cn/1989011035/zh_CN/index.htm
点击次数:
论文类型:期刊论文
发表时间:2012-01-01
发表刊物:情报学报
收录刊物:PKU、ISTIC、CSSCI
卷号:31
期号:11
页面范围:1202-1209
ISSN号:1000-0135
关键字:情感倾向性;跨领域;迁移学习;双重选择
摘要:情感倾向性分析旨在识别评论中隐含的情感信息,在产品声誉分析、舆情监控、个性推荐等方面具有广阔的应用前景.在评测消费者对新发布产品的态度时,本产品领域中可供参考的已分类评论数据往往较少,而其他相关领域可能存在大量的已分类的评论数据,利用其他产品已标注的评论数据对新产品进行情感倾向性分析,属于跨领域的情感分类问题.针对这一问题,本文引入迁移学习机制,将经典迁移学习TrAdaBoost算法的样本迁移机制应用于情感倾向性分析,并针对积极类和消极类分类精度不均衡问题提出了改进策略,首先根据评论样本权重进行第一次选择,其次结合分类置信度对评论样本进行第二次选择.实验结果表明,在整体分类精度有所提高的前提下,改进算法的优势在于均衡了积极类和消极类的分类精度,使得分类结果更具实际参考价值.