标题
  • 标题
  • 作者
  • 关键词

一种针对已知作者的姓名消歧方法

2018-12-15分类号:G252.7

【作者】范午攸  
【部门】上海交通大学图书馆  
【摘要】在外文期刊数据库中,同一姓名简称代表多位作者的现象十分普遍,严重影响作者检索的精度。本次研究将规则与算法相结合,依据规则为分类算法标注训练数据,从而在无监督条件下使用有监督算法,实现作者的精确检索。该算法适用于论文查证等已知作者身份的姓名消歧问题,相比通用的消歧方法,该方法结合无监督算法无需人工标注的优点,以及有监督算法高效率、易对应实体的优点。实践结果表明,该方法具有较高的准确度。
【关键词】作者姓名消歧  数据标注  分类算法  朴素贝叶斯
【基金】
【所属期刊栏目】图书馆杂志
文献传递