杨志豪
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:男
毕业院校:大连理工大学
学位:博士
所在单位:计算机科学与技术学院
电子邮箱:yangzh@dlut.edu.cn
扫描关注
基于问句相似度的中文FAQ问答系统
点击次数:
论文类型:期刊论文
发表时间:2007-03-21
发表刊物:计算机工程与应用
收录刊物:PKU、ISTIC、CSCD
卷号:43
期号:9
页面范围:161-163,248
ISSN号:1002-8331
关键字:问句相似度;语义相似度;常见问题集;向量空间模型
摘要:常见问题(FAQ)问答系统是一种在已有的"问题-答案"对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统.其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存储好的问题答案.通过对常见问句特点的研究,给出一种基于分解的向量空间模型和语义概念的问句相似度计算方法,其主要思想是对一个问句向量进行分解,提取其三个关键部分:问点、主题词和疑问词,表示成三个分向量,然后对每个分向量计算基于<HIT-IRLab同义词词林(扩展版)>的语义相似度,通过线性加权就可以得出两个问句的语义相似度.试验表明,与传统的基于向量空间模型的TF-DF问句相似度计算方法相比,可以提高问句匹配的精度.