Professor
Supervisor of Master's Candidates
Open time:..
The Last Update Time:..
Indexed by:期刊论文
Date of Publication:2010-01-01
Journal:情报学报
Included Journals:PKU、ISTIC、CSCD、CSSCI
Volume:29
Issue:5
Page Number:785-791
ISSN No.:1000-0135
Key Words:最大公共子图;文本相似度;图结构模型
Abstract:用图结构表示文本,能更好地反映文本内部的结构特征,体现文本内的语义关系及词语在上下文中的语序关系,在此基础上,本文提出了一种基于最大公共子图的文本相似度计算方法,应用最大公共子图提取文本的公共部分,并利用最大公共子图的性质度量文本间的相似程度.最后针对分类试验结果中存在的问题,提出图模型修正方法以改进文本的表示效果,并对修正前后不同β取值下的F-Score值进行比较.修正后的试验结果表明,基于最大公共子图的文本相似度算法有着较好的分类性能.