大连理工大学主页平台管理系统王宇基于句子的文本表示及中文文本分类研究 Home

Current position: Home >> Scientific Research >> Paper Publications

基于句子的文本表示及中文文本分类研究

Release Time:2019-03-10 Hits:

Indexed by: Journal Article

Date of Publication: 2009-01-01

Journal: 情报学报

Included Journals: CSSCI、CSCD、ISTIC、PKU

Volume: 28

Issue: 6

Page Number: 839-843

ISSN: 1000-0135

Key Words: 信息资源管理;句子包;文本表示;文本分类

Abstract: 文本挖掘技术是信息资源管理的一项关键技术.向量空间模型是文本挖掘中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项只能提供较少的语义信息.为实现基于内容的文本挖掘,本文将文本切分粒度从词语或短语提高到句子,用句子包表示文本,使用句子相似度定义文本相似度,用KNN算法进行中文文本分类,验证模型的可行性.实验证明,基于句子包的KNN算法的平均精度(92.12%)和召回率(92.01%)是比较理想的.

Prev One:基于句子关系图的网页文本主题句抽取

Next One:管理类本科专业的设置与培养规模的定位

Home

Scientific Research

Teaching Research

Awards and Honours

Enrollment Information

Student Information

My Album

Blog

基于句子的文本表示及中文文本分类研究