副教授 博士生导师 硕士生导师
性别: 男
毕业院校: 大连理工大学
学位: 博士
所在单位: 建设管理系
学科: 工程管理
办公地点: 综合实验四号楼517室
电子邮箱: shjiang@dlut.edu.cn
开通时间: ..
最后更新时间: ..
点击次数:
论文类型: 期刊论文
发表时间: 2006-01-01
发表刊物: 情报学报
收录刊物: PKU、ISTIC、CSCD、CSSCI
卷号: 25
期号: 4
页面范围: 499-503
ISSN号: 1000-0135
关键字: 逆向串频最大匹配;双向串频最大匹配;自动抽词;汉字共现模式
摘要: 针对作为中文信息处理基础的抽词问题,本文在作者提出的正向串频最大匹配法(MMFS)的基础上,提出了逆向串频最大匹配法(RMMFS)及双向串频最大匹配法(BMMFS).这两种方法分别采用逆向和双向长串优先与串频统计的思路,并引进规则和支持度指标筛选,不需要词典,不需要事先进行语料库学习,不需要建立字索引,通过串匹配获取中文文本中的汉字共现模式,实时地抽取出包含专业术语及专有名词等未登录词在内的专指语义串、短语和词.实验研究了抽词准确率受规则的影响及随文本大小和词频变化的分布,结果表明BMMFS可以取得更好的抽词效果.