Professor
Supervisor of Master's Candidates
Open Time: ..
The Last Update Time: ..
Hits:
Indexed by:Journal Article
Date of Publication:2010-01-01
Journal:情报学报
Included Journals:CSSCI、CSCD、ISTIC、PKU
Volume:29
Issue:5
Page Number:785-791
ISSN:1000-0135
Key Words:最大公共子图;文本相似度;图结构模型
Abstract:用图结构表示文本,能更好地反映文本内部的结构特征,体现文本内的语义关系及词语在上下文中的语序关系,在此基础上,本文提出了一种基于最大公共子图的文本相似度计算方法,应用最大公共子图提取文本的公共部分,并利用最大公共子图的性质度量文本间的相似程度.最后针对分类试验结果中存在的问题,提出图模型修正方法以改进文本的表示效果,并对修正前后不同β取值下的F-Score值进行比较.修正后的试验结果表明,基于最大公共子图的文本相似度算法有着较好的分类性能.