标题
  • 标题
  • 作者
  • 关键词

基于微博舆情监测的K-Means算法改进研究

2014-01-15分类号:TP311.13

【作者】朱晓峰  陈楚楚  尹婵娟  
【部门】南京工业大学经济与管理学院  
【摘要】在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。
【关键词】微博  网络舆情  K-Means算法
【基金】江苏省社会科学2012基金项目“江苏政府信息公开服务问题研究”(项目编号:12TQC013); 江苏省教育厅2011项目“基于生命周期的政府信息资源管理评价与测度”(项目编号:2011SJB870002)的研究成果
【所属期刊栏目】情报理论与实践
文献传递