标题
  • 标题
  • 作者
  • 关键词

基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例

2019-01-24分类号:G206;G254

【作者】曾子明  王婧  
【部门】武汉大学信息资源研究中心  武汉大学图书情报实验教学中心  
【摘要】网络谣言的肆虐对人们的日常生活和社会稳定造成了较为严重的负面影响,为了辅助网络谣言管控的有效推进,本文以2016年雾霾谣言为例,根据微博数据和以往研究定义了用户可信度和微博影响力特征变量,采用LDA主题模型深入挖掘微博文本的主题分布特征,并基于以上特征变量采用随机森林算法进行谣言识别的模型训练。实验表明,LDA提取的文档-主题分布特征在谣言识别中发挥了重要作用,且基于LDA的随机森林模型能够有效提高谣言识别的准确率。
【关键词】微博  谣言识别  LDA  随机森林  雾霾
【基金】教育部人文社会科学重点研究基地重大项目“大数据资源的智能化管理与跨部门交互研究——面向公共安全领域”(16JJD870003)
【所属期刊栏目】情报学报
文献传递