一种基于时序主题模型的网络热点话题演化分析系统
2013-05-05分类号:G350;G206
【部门】山东理工大学科技信息研究所
【摘要】设计基于网络数据的时序主题演化系统Hot Topics Analysis System(HTAS),实现网络热点话题数据源自动定制、自动获取和自动存储。针对中文话题分析,HTAS集成了Google的开源分词系统IKAnalyzer,批量处理中文文档。采用LDA模型对网络热点话题主题进行提取,并利用时间标签发现热点话题,通过图标形式可视化展示其演化规律。通过"钓鱼岛事件"的实验证明,HTAS系统能快速获取、存储网络热点话题,并能有效地分析其演化趋势。
【关键词】主题模型 话题演化 热点话题 LDA
【基金】山东理工大学2012年学生工作研究立项课题“新媒体时代大学生信息行为研究”研究成果之一
【所属期刊栏目】图书情报工作
文献传递