副教授 博士生导师 硕士生导师
性别: 男
毕业院校: 大连理工大学
学位: 博士
所在单位: 建设管理系
学科: 工程管理
办公地点: 综合实验四号楼517室
电子邮箱: shjiang@dlut.edu.cn
开通时间: ..
最后更新时间: ..
点击次数:
论文类型: 期刊论文
发表时间: 2006-01-01
发表刊物: 情报学报
收录刊物: PKU、ISTIC、CSCD、CSSCI
卷号: 25
期号: 3
页面范围: 301-305
ISSN号: 1000-0135
关键字: 中英文混合术语;中文信息处理;串频;长串优先
摘要: 中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量.依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法.该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语.该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词.实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取.