基于领域特征和用户查询取样的Deep Web数据源描述方法
2017-09-21分类号:TP391.3
【部门】中国科学院文献情报中心 中国科学院大学
【摘要】[目的/意义]数据源描述(又称数据源摘要)是Deep Web集成检索领域存在的关键问题之一,数据源描述的质量直接影响着集成检索系统的检索效率和效果。本文提出一种基于领域特征和用户查询取样的数据源描述方法,以期为非合作环境下资源集成应用与研究提供参考和借鉴。[方法/过程]该方法为异构非合作型数据源的离线取样方法,通过分析数据源和用于查询的领域主题属性,依次构建领域特征词集、初始特征词集和高频特征词集,并最终获得以高频特征词查询取样的数据源描述信息。结合流行的CORI算法,深入分析基于推理网络的用户查询与数据
【关键词】深层网络 数据源描述 查询取样 推理网络
【基金】国家社会科学基金项目“基于开放获取学术期刊的资源深度整合与揭示研究”(项目编号:16BTQ025)研究成果之一
【所属期刊栏目】图书情报工作
文献传递