标题
  • 标题
  • 作者
  • 关键词

融合多维特征的学术文献下载行为预测研究

2021-07-07分类号:G353.1

【作者】谢豪  吴雪华  陈茜  唐晶  白云  毛进  
【部门】武汉大学信息资源研究中心  
【摘要】[目的/意义]学术文献下载行为是科研人员文献检索行为的重要一环,对其预测的研究有助于深度理解科研人员检索行为,为学术资源检索平台优化检索结果、重构排序提供依据,从而提升检索系统的服务质量。[方法/过程]构建用户学术文献下载行为的多维特征体系,在机器学习算法基础上构造基于查询相关性和基于用户行为的子分类器,并采取加权策略构建学术文献下载行为预测混合模型。[结果/结论]实验结果表明,随机森林算法在两种分类器上均取得最佳性能;相较于仅基于查询相关性特征训练的模型,混合模型的准确率提高了2.3%,F1值提升了1.3%。在混合模型中,基于用户行为的子分类器拥有更高权重;"下载量""是否采用专业/高级检索"和"发表时间"特征的贡献度较大。
【关键词】文献下载预测  多维特征  机器学习  混合模型
【基金】国家自然科学基金创新研究群体项目“信息资源管理”(项目编号:71921002);国家自然科学基金青年项目“基于学术异质网络表示学习的知识群落发现”(项目编号:71804135)研究成果之一
【所属期刊栏目】图书情报工作
文献传递