基于深度学习的网络科技信息情报价值计算方法研究
2021-10-27分类号:G350
【部门】中国科学院武汉文献情报中心 中国科学院文献情报中心 中国科学院大学经济与管理学院图书情报与档案管理系 科技大数据湖北省重点实验室 华中师范大学国家文化产业研究中心
【摘要】[目的/意义]针对当前科研人员无法从海量的网络科技信息中及时甄别有情报价值的情报内容的问题,建立一套综合性情报价值计算方法,从而对网络科技信息的情报价值进行计算判断,最终帮助科研人员快速而准确地发现有情报价值的网络科技信息。[方法/过程]综合考虑情报外部特征与文本语义内容特征,利用深度学习(预训练语言模型)BERT方法构建基于文本语义内容特征的情报价值计算模型,利用深度学习模型的预测输出完成打分,并结合基于情报外部特征的原始计算方法得到最终的综合评价得分。[结果/结论]实验结果显示,基于文本语义内容特征的情报价值计算模型可以对情报按照情报价值得分进行有效的星级区分,弥补了基于情报外部特征的原始计算模型中星级区分度差的问题,最终的综合评价结果表明本文提出的情报价值计算模型在实际应用中也能够很好地满足科研人员的需求。
【关键词】网络科技信息 情报价值计算 文本语义内容 BERT
【基金】国家自然科学基金项目“基于CityGML的三维古建筑语义建模研究”(项目编号:41801295);; 中国科学院文献情报能力建设专项项目“网络科技监测平台智能分析核心能力升级”(项目编号:Y9290906)研究成果之一
【所属期刊栏目】图书情报工作
文献传递