标题
  • 标题
  • 作者
  • 关键词

数据缺失时基于BP神经网络的作者重名辨识研究

2018-06-24分类号:TP183

【作者】柯昊  李天  周悦  钟玉颖  俞征鹿  袁军鹏  
【部门】中央财经大学  中国科学技术信息研究所  中国科学院文献情报中心  中国科学院大学经济与管理学院  
【摘要】作者重名辨识工作是情报学、知识管理、文献计量学与科学计量学等工作的基础,在利用聚类、分类等机器学习方法进行作者重名辨识时,论文元数据中各字段缺失情况非常严重,会导致算法失效。针对这一现象,本研究主要聚焦于较准确地确定每一字段在作者重名辨识上的能力,通过构建字段贡献度评价体系,在数据缺失情况下,计算现有的每项信息在作者重名辨识中的作用,即"贡献度"。设计了组合的唯一性指标,并建立了一个基于BP神经网络的作者重名辨识算法,利用"王伟"的论文进行实验,验证了所提算法的有效性和可靠性。
【关键词】重名辨识  数据缺失  BP神经网络  科学计量学
【基金】国家自然科学基金面上项目“中英文论文中的中国作者姓名消歧研究”(71473236)
【所属期刊栏目】情报学报
文献传递