标题
  • 标题
  • 作者
  • 关键词

面向特定科研任务的著者姓名消歧方法

2021-07-24分类号:TP391.1

【作者】吴柯烨  闵超  孙建军  权昭瑄  
【部门】南京大学信息管理学院  南京大学人文社会科学大数据研究院  
【摘要】人才流动、学者评价等以学者个人为对象的研究任务,通常需要针对学术论著数据集中的著者进行姓名消歧。本文针对此类特定研究任务,提出了准确且便于学者操作的姓名消歧方法。为简便计算,弥补本地数据缺失的问题,本文构建了基于异源数据的二阶段姓名消歧框架。一阶段充分挖掘本地关联信息,二阶段结合权威的外源数据。基于表征进行本地关系发现、半模糊检索等步骤,以达到全面客观的姓名消歧,最终通过人工智能领域的论文数据和Aminer姓名消歧数据集,实现并验证该方法的优越性和普适性。经过与人工标注数据对比,该框架表现出良好的消歧效果,较好地解决了原始数据中的同名异人和同人异名问题,从而为后续研究任务奠定了扎实的基础。
【关键词】特定研究任务  二阶段姓名消歧  异源数据  关系发现  半模糊检索
【基金】教育部人文社会科学基金项目“施引群体视角的科学产出评价方法研究”(19YJC870017);; 国家自然科学基金项目“引文模式视角下的科学突破研究”(71904081),“引文扩散理论及实证研究”(71874077)
【所属期刊栏目】情报学报
文献传递