标题
  • 标题
  • 作者
  • 关键词

学术文本词汇功能识别——在论文新颖性度量上的应用

2022-07-24分类号:G254

【作者】罗卓然  陆伟  蔡乐  程齐凯  
【部门】武汉大学信息管理学院  武汉大学信息检索与知识挖掘研究所  
【摘要】为进一步挖掘学术论文新颖性的丰富内涵,本文以组合创新理论为基础,开展了基于词汇功能的学术论文新颖性度量研究。以ACM (Association for Computing Machinery) Digital Library收录的论文为数据,提出了面向CS(computer science)领域进一步预训练的词汇新颖性计算方法和基于语义相似度的问题-方法组合新颖度计算流程,分别计算了问题词、方法词、问题-方法组合和论文的语义新颖性,并将本文语义新颖性计算方法与已有的词频共现新颖性计算方法进行了对比。研究结果表明,ACM Digital Library收集的论文在研究方法和研究问题上创新度均较高,相较于已有的论文新颖性计算方法,本文提出的方法能从语义层面捕获更为精细的新颖性差异。
【关键词】新颖性度量  词汇功能  问题-方法组合  预训练模型
【基金】国家社会科学基金重大项目“基于认知计算的学术论文评价理论与方法研究”(17ZDA292)
【所属期刊栏目】情报学报
文献传递