标题
  • 标题
  • 作者
  • 关键词

基于BERTopic算法的引文主题实证分析——以一篇高被引诺贝尔生理学或医学奖论文为例

2024-04-30分类号:G353.1

【作者】郭倩影   赵丹群
【部门】北京大学信息管理系  
【摘要】[目的/意义]引文主题识别/分析(CTR/CTA)是引文内容分析(CCA)的一项重要研究议题,通过对引文语料中蕴涵主题信息的识别和提取,可望为论文学术贡献评价、知识扩散及演化分析等问题的解决提供新的研究思路。[过程/方法]以一篇高被引诺贝尔生理学或医学获奖关键论文为例,采用BERTopic算法对其引文句语料进行主题识别,并对识别出的引文主题展开多个维度的分析与讨论。[结果/结论]对高被引论文开展引文主题识别分析,有助于更全面细致地揭示其学术贡献内容及演化趋势;BERTopic算法能较好识别案例文献的多个引文主题,且不同引文主题的施引文献特征分布不尽相同;对引文主题重要性、演化趋势及其与原文主题差异性的分析,能多维度刻画研究同行对案例文献学术贡献的认识,表明CTR/CTA研究对学术论文评价具有深入探索价值。
【关键词】BERTopic算法  引文主题识别  引文主题分析  引文内容分析  学术论文评价
【基金】
【所属期刊栏目】情报理论与实践
文献传递