标题
  • 标题
  • 作者
  • 关键词

从数据挖掘偏差到文献计量偏差

2017-10-12分类号:G353.1

【作者】王冰璐  步一  徐扬  刘姝雯  
【部门】北京大学信息管理系  印第安纳大学信息学与计算机学院  
【摘要】[目的/意义]互联网的迅猛发展使得信息量增速不断加快。作为从海量数据中发现有用知识的有力手段,数据挖掘成为近年的研究热点。然而在数据挖掘过程中,输出值和真实值之间往往存在着一定的差距,即数据挖掘偏差。[方法/过程]通过相关研究综述了数据挖掘偏差的概念、研究进展以及发展方向,并以数据挖掘的基本步骤类比文献计量的基本步骤,进而提出文献计量偏差的基本概念。从文献来源选取、文献数据预处理、文献计量方法选取和计量结果解读4个角度重点论述了文献计量偏差的主要表现方式和解决办法。[结果/结论]文章旨在呼吁未来该领域的相
【关键词】数据挖掘  数据挖掘偏差  文献计量学  文献计量偏差
【基金】
【所属期刊栏目】情报理论与实践
文献传递