大数据视角下名录库更新维护——基于互联网异源异构数据整合的探讨
2015-01-15分类号:C829.2
【部门】兰州商学院 兰州商学院统计学院 国家统计局统计科学研究所
【摘要】统计系统基本单位名录库是统计数据质量的基石,现有数据源在成本、时效性、数据提供者负担方面存在劣势。为此,本文提出一种互联网大数据整合视角下的名录库更新维护思路:从参与者行为、数据质量角度论证了将异源异构互联网数据作为名录库更新数据源的优势,讨论了名录库基本信息、属性信息及地理定位信息获取的技术手段,并给出应用实例。
【关键词】大数据 名录库 政府统计 数据质量
【基金】教育部人文社会科学重点研究基地重大项目“政府统计数据质量保证体系研究”(12JJD790010);; 全国统计科学研究重点项目“海量异源异构数据的采集、存储和分析方案研究”(2013LZ44);全国统计科学研究重点项目“基于普查涵盖误差测量技术的基本单位名录库维护与更新研究”(2011LX003)资助
【所属期刊栏目】统计研究
文献传递