标题
  • 标题
  • 作者
  • 关键词

面向检索结果集的结构化综述智能生成研究

2024-01-10分类号:TP391.1;G252.7;TP18

【作者】孟旭阳   陈阳   白海燕
【部门】中国科学技术信息研究所  
【摘要】[目的/意义]在学术文献检索与阅读场景下,当前学术信息量已远超用户信息处理能力,造成信息堆积。为应对用户阅读效率与知识吸收难题,面向学术文献检索结果集开展内容的综合挖掘揭示。[方法/过程]一方面从阅读体验出发,针对文献检索场景的特点,进行结构化综述表达设计;另一方面从技术方法与内容质量提升出发,利用基于深度学习的文本自动生成技术,构建科技文献数据集,训练并优化文本摘要模型,在此基础上利用大语言模型技术实现结构化的综述文本生成。[结果/结论 ]训练优化后的摘要模型在各指标的召回率和F1值上平均增长2.07%。基于大模型的结构化综述生成,在实际测评中能够有效地提炼、总结和归纳内容要点,验证本文技术路线和应用实践的可行性,为进一步提升学术文献的知识化服务水平、智能辅助阅读与语义内容综合挖掘揭示等方面提供应用实践指南。
【关键词】文献检索  结构化综述  大语言模型  文本自动生成
【基金】国家重点研发计划项目“科技文献内容深度挖掘及智能分析关键技术和软件”(项目编号:2022YFF0711900);; 中国科学技术信息研究所创新研究基金青年项目“面向检索结果集的结构化综述研究”(项目编号:QN2023-11)研究成果之一~~
【所属期刊栏目】图书情报工作
文献传递