智能检索中基于生成式模型和伪相关反馈的查询扩展方法
2024-07-31分类号:TP391.3
【部门】西安电子科技大学经济与管理学院 陕西信息资源研究中心
【摘要】[目的/意义]为改善检索系统中伪相关反馈对初检文档集过度依赖和生成式模型未考虑相关文档中潜在扩展项等问题,提出一种基于生成式模型和伪相关反馈的查询扩展模型。[方法/过程]综合生成式模型和伪相关反馈两种方法的优势,分别采用查询生成模型和伪相关反馈生成候选扩展词集,将两种候选扩展词集合并得到最终扩展词集,实现查询扩展。最后,以NQ和TriviaQA两个标准开放域问答数据集为实验语料,基于密集检索验证所提出查询扩展方法的有效性。[结果/结论 ]实验结果表明,所提出模型检索结果 Top-k的检索准确率和EM均高于基准方法;另外,测试伪相关反馈查询词数量、生成式模型上下文类别以及问题类别对模型性能的影响,实验结果验证了所提出方法的有效性。所提出方法能够提高查询扩展词质量,改善信息检索性能。
【关键词】查询扩展 文本生成 伪相关反馈 信息检索
【基金】国家社会科学基金重点项目“场景驱动的我国关键核心领域文献资源精细组织与精准服务模式研究”(项目编号:22ATQ002)研究成果之一~~
【所属期刊栏目】图书情报工作
文献传递