副教授 博士生导师 硕士生导师
性别: 男
毕业院校: 大连理工大学
学位: 博士
所在单位: 建设管理系
学科: 工程管理
办公地点: 综合实验四号楼517室
电子邮箱: shjiang@dlut.edu.cn
开通时间: ..
最后更新时间: ..
点击次数:
论文类型: 期刊论文
发表时间: 2007-01-20
发表刊物: 计算机工程
收录刊物: PKU、ISTIC、CSCD
卷号: 33
期号: 2
页面范围: 47-49
ISSN号: 1000-3428
关键字: 专指语义串;长串优先;字母词语;中文信息处理
摘要: 新术语的提取是中文信息处理领域的一个重要研究课题.针对现有提取方法的不足和很多专业术语表现为字母词语的特点,该文提出了一种综合统计技术和规则筛选的方法:基于长串优先和串频统计的思路进行文本切分,得到共现字符串,利用词语搭配规则进行过滤,经过领域词典及评价函数的筛选,提取出领域新术语.该方法可发现包含字母词语、专业术语等未登录词在内的频率大于等于2的任意长度的专指语义串、短语和词.实验表明了该方法的有效性及新术语的准确率分布特征.