的个人主页 http://faculty.dlut.edu.cn/1989011035/zh_CN/index.htm
点击次数:
论文类型:期刊论文
发表时间:2010-01-01
发表刊物:情报学报
收录刊物:PKU、ISTIC、CSCD、CSSCI
卷号:29
期号:5
页面范围:785-791
ISSN号:1000-0135
关键字:最大公共子图;文本相似度;图结构模型
摘要:用图结构表示文本,能更好地反映文本内部的结构特征,体现文本内的语义关系及词语在上下文中的语序关系,在此基础上,本文提出了一种基于最大公共子图的文本相似度计算方法,应用最大公共子图提取文本的公共部分,并利用最大公共子图的性质度量文本间的相似程度.最后针对分类试验结果中存在的问题,提出图模型修正方法以改进文本的表示效果,并对修正前后不同β取值下的F-Score值进行比较.修正后的试验结果表明,基于最大公共子图的文本相似度算法有着较好的分类性能.