生物医学领域突破性论文识别研究
2024-07-31分类号:R318;G353.1
【部门】北京理工大学管理学院 中国医学科学院医学信息研究所/图书馆
【摘要】[目的/意义]科学的重大进步在很大程度上取决于突破性发现,突破性论文作为突破性发现的重要载体,其识别与发现对科技政策制定与基础研究培育具有重要作用。[方法/过程]针对目前定量识别方法使用特征维度单一且与科学突破概念性质缺乏紧密联系等问题,结合生物医学领域突破性研究特征,提出一种能够更全面、准确地反映突破性创新规律与特点的突破性论文识别方法。从知识创新、扩散、传播路径、融合性、不确定性与争议性等维度构建指标,测度突破性论文的新颖性、影响力、科学破坏性、学科交叉性、争议性特征,应用随机森林模型并将特征指标作为输入变量构建生物医学领域突破性识别模型,最后对模型进行性能评估与参数调优。[结果/结论 ]生物医学领域突破性论文识别模型的F1值为0.834 1,影响力、争议性和科学破坏性特征指标对该模型的识别结果影响较大。在拉斯克奖获得者的精选论文、肿瘤领域的里程碑文献组成的新样本中,该模型保持较稳定的识别效果和较好的泛化性能。
【关键词】突破性论文 突破性特征 随机森林模型 生物医学领域
【基金】国家自然科学基金面上项目“生物医学领域潜在颠覆性技术识别方法研究”(项目编号:72074020);国家自然科学基金青年项目“多源异质网络视角下产学研合作产生机理及潜在机会发现研究”(项目编号:72004009)研究成果之一;; 中国医学科学院医学与健康科技创新工程“生物医学文献信息保障与集成服务平台”(项目编号:2021-I2M-1-033)~~
【所属期刊栏目】图书情报工作
文献传递