标题
  • 标题
  • 作者
  • 关键词

领域文献深层语义特征视角下的期刊新兴研究主题发现

2023-10-17分类号:G353.1

【作者】刘江峰   王希羽   张君冬   孔玲   裴雷   王东波
【部门】南京大学信息管理学院  南京大学数据智能与交叉创新实验室  南京农业大学信息管理学院  南京农业大学人文与社会计算研究中心  山东理工大学信息管理学院  
【摘要】[目的/意义]从文献深层语义特征角度分析特定领域期刊研究内容中蕴含的新兴主题,对科研工作者了解领域研究热点、寻找进一步研究的方向具有重要意义。[方法/过程]首先,以图书情报领域期刊JASIST为例,从文献句子的语义特征角度出发,使用BERT及其衍生模型进行关键句子的识别;其次,基于MLM提出语言模型的增强方案;最后,使用BERTopic在识别结果的基础上进行面向关键研究语句和摘要的新兴主题发掘及演化分析。[结果/结论]整体句子识别性能F1值超80%,基于MLM的领域模型在关键句子识别上较基准模型性能提升约1~2个百分点,基于BERTopic发现7个新兴热点研究主题。本文提出的关键句子识别和基于BERTopic的主题计算方案能够有效挖掘新兴主题,为科研工作者提供辅助。
【关键词】预训练语言模型  掩码语言模型  主题计算  BERTopic
【基金】
【所属期刊栏目】情报理论与实践
文献传递