Hits:
Indexed by:期刊论文
Date of Publication:2004-08-28
Journal:计算机工程与设计
Included Journals:PKU、ISTIC
Volume:25
Issue:8
Page Number:1411-1414
ISSN No.:1000-7024
Key Words:Web信息抽取;Agent;XML;抽取规则
Abstract:在以前相关研究的基础上,提出了一个建立在Agent和XML基础上的Web页面信息抽取的原型系统.在这个原型系统里,利用Agent的自治能力和合作能力来协助用户对抽取请求进行公式化表述和结合知识库学习抽取规则等.另外,系统还用XML语言描述抽取请求和抽取规则,在其中加入一些语义信息,这些语义信息可被有效利用,从而提高抽取的精确性.