党延忠

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:系统工程研究所

学科:管理科学与工程. 系统工程

电子邮箱:yzhdang@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

无词典中英文混合术语抽取及算法研究

点击次数:

论文类型:期刊论文

发表时间:2006-01-01

发表刊物:情报学报

收录刊物:PKU、ISTIC、CSCD、CSSCI

卷号:25

期号:3

页面范围:301-305

ISSN号:1000-0135

关键字:中英文混合术语;中文信息处理;串频;长串优先

摘要:中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量.依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法.该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语.该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词.实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取.