Indexed by:期刊论文
Date of Publication:2018-11-21
Journal:中国科学:信息科学
Issue:11
Page Number:1510-1520
ISSN No.:1674-7267
Key Words:谐音双关语;情感分析;二叉判定树;语义特征集;聚类
Abstract:谐音双关语的识别是幽默研究领域的一个重要分支,并逐渐发展为一个新兴的研究领域.本文提出一种基于4个维度特征集的谐音双关语识别模型,其中4个维度包括语义透明度、语义相关度、语音扩展性和语法特征集.语义透明度包括词项统计和语句字符长度两个特征,语法特征集包括人名、大写、时态、词性和位置5个特征.将这4个维度的9个特征加入到二叉判定树中,使用K-Means聚类获取阈值,完成双关语的识别.本文的实验数据来自于SemEval2017任务7的语料,取得了较好的效果, F1值高于参赛队中的第一名,实验证明基于4个维度特征的二叉判定树分类方法在谐音双关语识别中是有效的,并且在多个特征中,语音扩展性和语法特征集的效果比较明显,这也符合谐音双关语识别中语音作用较大的预测.
Associate Professor
Supervisor of Master's Candidates
Gender:Male
Alma Mater:大连理工大学
Degree:Doctoral Degree
School/Department:计算机科学与技术学院
Business Address:创新园大厦A1028
Contact Information:liang@dlut.edu.cn
Open time:..
The Last Update Time:..