一对多轮换估计法下的同伴驱动抽样方法探讨
2019-11-25分类号:C811
【部门】太原师范学院经济系 山西财经大学信息与管理学院 山西财经大学统计学院
【摘要】在研究微博用户行为时,研究者常需要利用抽样数据来估计微博用户的总体比例。然而互联网数据具有的海量性和不稳定性导致在微博环境下使用概率抽样方法出现困难。文章分析了一种非概率抽样方法——同伴驱动抽样方法,并引入了一对多轮换估计的概念,提出了一对多轮换估计法下的同伴驱动抽样,来估测微博用户的总体比例。经过理论推导和实证检验,一对多轮换估计法下的同伴驱动抽样方法能够有效地估计多类微博用户的总体比例,是一种可推广于社交网络数据采集的大数据抽样方法。
【关键词】同伴驱动抽样 比例估计 一对多轮换估计法 大数据抽样
【基金】国家社会科学基金资助项目(17BTJ010)
【所属期刊栏目】统计与决策
文献传递