基于微博舆情监测的K-Means算法改进研究

2014-01-15分类号：TP311.13

【作者】朱晓峰陈楚楚尹婵娟

【部门】南京工业大学经济与管理学院

【摘要】在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。

【关键词】微博网络舆情 K-Means算法

【基金】江苏省社会科学2012基金项目“江苏政府信息公开服务问题研究”(项目编号:12TQC013); 江苏省教育厅2011项目“基于生命周期的政府信息资源管理评价与测度”(项目编号:2011SJB870002)的研究成果

【所属期刊栏目】情报理论与实践

文献传递