Qr code
DALIAN UNIVERSITY OF TECHNOLOGY Login 中文
吴江宁

Professor
Supervisor of Master's Candidates


Gender:Female
Alma Mater:香港大学
Degree:Doctoral Degree
School/Department:系统工程研究所
Discipline:Management Science and Engineering
Business Address:管理学院 223房间
E-Mail:jnwu@dlut.edu.cn
Click: times

Open time:..

The Last Update Time:..

Current position: Home >> Scientific Research >> Paper Publications

基于图结构的中文文本表示方法研究

Hits : Praise

Indexed by:期刊论文

Date of Publication:2010-01-01

Journal:情报学报

Included Journals:PKU、ISTIC、CSCD、CSSCI

Volume:29

Issue:4

Page Number:618-624

ISSN No.:1000-0135

Key Words:图结构模型;文本表示;文本相似度;最大公共子图

Abstract:为解决基于统计的文本表示模型的信息缺失问题,本文提出了一种考虑词间语义和语序信息的基于图结构的中文文本表示方法,其思想是将文本的特征项表示成图结构中的节点,特征项间的关系表示成节点间的有向边,据此可将文本表示成由节点和有向边组成的图结构,并且将边赋予权重信息,该模型较大程度地保留了原文本的结构信息及语义信息.中文语料测试结果表明,基于图结构的文本表示方法对复杂文本语料的分类问题十分有效.对于简短文本语料,本文提出扩展特征项共现单元的修正方法,提高了图结构中文文本表示方法的普遍适用性.