大数据在价格调查中的应用研究
2017-04-11分类号:F726
【部门】调研世界
【摘要】文章利用数据爬虫软件从淘宝网和卓创资讯网抓取上百万条数据,对数据进行清洗、选择和处理后,利用所得网络大数据,计算了PPI、CPI;运用K均值聚类、层次聚类对数据进行了分析;运用随机森林和深度学习算法对大数据价格指数进行数据挖掘,并将大数据计算的价格指数和数据挖掘价格指数结果与国家统计局公布数据进行比较分析。最后得出结论,基于大数据的PPI和CPI指数计算和数据挖掘模型的结果是有效的、切实可行的,并提出推动大数据应用于价格指数调查的相关政策建议。
【关键词】数据挖掘 数据爬虫 价格调查 层次聚类 随机森林
【基金】
【所属期刊栏目】调研世界
文献传递