标题
  • 标题
  • 作者
  • 关键词

一种基于时间序列的热点话题发现模型和算法

2017-10-05分类号:TP391.1

【作者】魏德志  陈福集  林丽娜  
【部门】集美大学诚毅学院  福州大学经济与管理学院  
【摘要】【目的/意义】网络舆情的热点话题对政府和网民有着很大的影响,及时发现热点话题有利于政府监控话题的发展。【方法/过程】本文提出了基于时间序列的话题动态演化两层模型,并将新闻网页内容的相似度和页面链接分析作为话题热度的计算依据,然后利用改进的Single-Pass算法进行增量聚类获得聚类中心,最后根据热度权重将聚类中心进行排序,获得热点话题。【结果/结论】通过实验验证,该算法发现效果好,能够更好地获得热点话题。
【关键词】网络舆情  时间序列  话题发现  聚类  话题演化
【基金】国家自然科学基金项目(71271056);; 福建省教育厅项目(C13001,JA14368)
【所属期刊栏目】情报科学
文献传递