全自动生成网页信息抽取包装器的主要技术方法研究
2010-01-30分类号:TP391.1
【部门】北京大学信息管理系 中国科学院国家科学图书馆 中国科学院研究生院 解放军艺术学院教育技术中心
【摘要】网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
【关键词】信息抽取 包装器 信息技术 深层网
【基金】
【所属期刊栏目】情报理论与实践
文献传递