基于云计算的网络舆情藤蔓式串并行聚类方法研究
2017-02-18分类号:TP391.1;G206
【部门】湘南学院软件与通信工程学院
【摘要】[目的/意义]针对目前在线网络海量信息难以快速获取其舆情的问题,为有效提升舆情获取速度,提出一种基于云计算的网络舆情藤蔓式串并行聚类方法。[方法/过程]首先构建舆情文本相似性度量模型,并设计确定舆情最佳聚类阈值的方法,以度量舆情信息间的相似性及确定舆情最佳聚类阈值;然后构建舆情藤蔓式串并行聚类模型,以一个舆情主题为聚类起始,之后如藤蔓的主干自动分支和延伸样,自主扩展舆情聚类主题,并根据舆情信息间的相似性和聚类阈值聚类同主题的舆情信息;最后在舆情藤蔓式串并行聚类模型的基础上,利用云计算的并行计算能力,快速、
【关键词】在线网络舆情 云计算 文本相似性 藤蔓式串并行聚类
【基金】教育部人文社会科学研究项目“基于大数据分析的在线社会网络舆情挖掘及风险管控研究”(编号:15YJC870004);; 湖南省哲学社会科学基金项目“网络环境下社会舆情危机事件的识别及评价策略研究”(编号:13YBA302)
【所属期刊栏目】情报杂志
文献传递