标题
  • 标题
  • 作者
  • 关键词

全自动生成网页信息抽取包装器的主要技术方法研究

2010-01-30分类号:TP391.1

【作者】李广建  乔建忠  
【部门】北京大学信息管理系  中国科学院国家科学图书馆  中国科学院研究生院  解放军艺术学院教育技术中心  
【摘要】网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
【关键词】信息抽取  包装器  信息技术  深层网
【基金】
【所属期刊栏目】情报理论与实践
文献传递