标题
  • 标题
  • 作者
  • 关键词

数据论文引证意图自动识别研究——以生物医学领域为例

2024-05-06分类号:G353.1

【作者】黄珊   刘茹   石燕青   杨波
【部门】南京农业大学人工智能学院  南京农业大学信息管理学院  
【摘要】[目的/意义]探索数据论文引用意图自动识别方法,为实现更高效的科学数据组织和数据共享提供参考和依据。[方法/过程]以生物医学领域为例,在构建大规模数据论文引用句标准语料库的基础上,通过引用句的内容特征对引用意图进行分类,提出基于深度学习技术的数据论文引用意图自动识别方法。[结果/结论]利用文本分类手段对数据论文引用意图进行自动识别具有可行性,深度预训练的语言模型PubMedBert性能优良且具有明显的领域优势,能够应用于大规模语料实践任务中。在数据论文引用意图中,半数以上是实质性引用且这类引用呈上升趋势。
【关键词】数据论文  引用意图  开放科学  文本分类
【基金】国家社会科学基金一般项目“科学数据集的自组织模式和质量评价研究”的成果之一,项目编号:18BTQ077
【所属期刊栏目】情报理论与实践
文献传递