论文名称:基于广义 Jaccard 系数的微博情感新词判定 论文类型:期刊论文 发表刊物:山东大学学报(理学版) 收录刊物:PKU、ISTIC、CSCD 卷号:50 期号:7 页面范围:71-75,79 ISSN号:1671-9352 关键字:特征向量;点互信息;无监督;距离差 摘要:微博情感新词的极性判定是情感分析研究中的一项基本任务,旨在对新词进行情感分类。针对极性判定的问题,提出一种新的计算特征向量相似度的算法。该方法首先使用特征向量表示情感新词和已有情感词,利用点互信息计算特征权值;然后采用广义 Jaccard 系数分别计算情感新词与已有的三种极性的情感词集内情感词的相似度,词集内相似度之和即为情感新词与该情感词集的相关度;最后,通过情感新词与三个极性情感词集的相关度的距离差判定其极性。实验结果表明,基于广义 Jaccard 系数的情感新词极性判定算法得出的 F 值比 COAE 2014参赛队伍的最好成绩高两个百分点。 发表时间:2015-07-20