王宇
个人信息Personal Information
教授
硕士生导师
性别:男
毕业院校:吉林大学
学位:博士
所在单位:信息管理与信息系统研究所
学科:信息管理与电子政务
办公地点:管理楼518
电子邮箱:ywang@dlut.edu.cn
扫描关注
基于HNC理论的中文文本词汇链构造方法
点击次数:
论文类型:期刊论文
发表时间:2016-02-18
发表刊物:情报杂志
收录刊物:PKU、ISTIC、CSSCI
卷号:35
期号:2
页面范围:182-187
ISSN号:1002-1965
关键字:词汇链;语义计算;HNC理论;依存句法
摘要:[目的/意义]词汇链是文本中一系列词汇关联而成的语义链。构造词汇链有助于读者把握文本主题,对知识元构建、自动文摘生成等领域研究有重要价值。[方法/过程]借鉴HNC理论的概念层次原理对词汇语义进行形式化描述,利用HNC的符号和同行优先准则,及依存句法揭示的多义词上下文信息,对词语语义进行消歧处理,进而运用HNC语义相似度计算方法获得词语的语义关联性。[结果/结论]在此基础上,提出词汇链构建算法,并对词汇链进行优选处理,获得优选词汇链。实验结果表明,基于HNC理论和依存句法提出的词汇链构造方法的可接受度较高。