党延忠
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:男
毕业院校:大连理工大学
学位:博士
所在单位:系统工程研究所
学科:管理科学与工程. 系统工程
电子邮箱:yzhdang@dlut.edu.cn
扫描关注
无词典中文特征词自动抽取的桥接模式滤除算法
点击次数:
论文类型:期刊论文
发表时间:2007-07-15
发表刊物:计算机应用研究
收录刊物:PKU、ISTIC、CSCD
卷号:24
期号:7
页面范围:168-170
ISSN号:1001-3695
关键字:自动分词;桥接模式滤除算法;中文信息处理
摘要:提出一种不依赖于词典的抽取文本特征词的桥接模式滤除算法(BPFA).该算法统计文本中的汉字结合模式及其出现频率,通过消除桥接频率得到模式的支持频率,并依此来判断和提取正确词语.实验结果显示,BPFA能够有效提高分词结果的查准率和查全率.该算法适用于对词语频率敏感的中文信息处理应用,如文本分类、文本自动摘要等.