李丽双

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:女

毕业院校:大连理工大学

学位:博士

所在单位:计算机科学与技术学院

学科:计算机应用技术. 计算机软件与理论

办公地点:创新大厦A930

电子邮箱:lils@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于词语关系的词向量模型

点击次数:

论文类型:期刊论文

发表时间:2017-05-15

发表刊物:中文信息学报

收录刊物:CSCD

卷号:31

期号:3

页面范围:25-31

ISSN号:1003-0077

关键字:词表示 词嵌入 词向量 神经网络 关系模型 word representation word embedding word vectors neural network relation model

摘要:词向量能够以向量的形式表示词的意义,近来许多自然语言处理应用中已经融入词向量,将其作为额外.特征或者直接输入以提升系统性能.然而,目前的词向量训练模型大多基于浅层的文本信息,没有充分挖掘深层的依存关系.词的词义体现在该词与其他词产生的关系中,而词语关系包含关联单位、关系类型和关系方向三个属性,因此,该文提出了一种新的基于神经网络的词向量训练模型,它具有三个顶层,分别对应关系的三个属性,更合理地利用词语关系对词向量进行训练,借助大规模未标记文本,利用依存关系和上下文关系来训练词向量.将训练得到的词向量在类比任务和蛋白质关系抽取任务上进行评价,以验证关系模型的有效性.实验表明,与skipgram模型和CBOW模型相比,由关系模型训练得到的词向量能够更准确地表达词语的语义信息.