党延忠

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:系统工程研究所

学科:管理科学与工程. 系统工程

电子邮箱:yzhdang@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

自动提取含字母词语的领域新术语的研究

点击次数:

论文类型:期刊论文

发表时间:2007-01-20

发表刊物:计算机工程

收录刊物:PKU、ISTIC、CSCD

卷号:33

期号:2

页面范围:47-49

ISSN号:1000-3428

关键字:专指语义串;长串优先;字母词语;中文信息处理

摘要:新术语的提取是中文信息处理领域的一个重要研究课题.针对现有提取方法的不足和很多专业术语表现为字母词语的特点,该文提出了一种综合统计技术和规则筛选的方法:基于长串优先和串频统计的思路进行文本切分,得到共现字符串,利用词语搭配规则进行过滤,经过领域词典及评价函数的筛选,提取出领域新术语.该方法可发现包含字母词语、专业术语等未登录词在内的频率大于等于2的任意长度的专指语义串、短语和词.实验表明了该方法的有效性及新术语的准确率分布特征.