基于词项热度的微博热点话题发现研究
2018-04-04分类号:暂无
【部门】西安电子科技大学经济与管理学院
【摘要】【目的/意义】随着网民规模的扩大以及微博数据的增长,获取微博空间的热点话题是一项有价值的任务。本文结合微博的特点提出专门针对中文微博的热点话题发现模型。【过程/方法】本文提出利用词项H指数筛选出热点词项,然后利用BTM建模和VSM建模的结果相融合计算文本相似度,再利用k-means聚类算法发现微博的热点话题。【结果/结论】本文在提取特征阶段既考虑了微博词项的热度又考虑了其短文本性,通过实验验证本文提出的方法有利于发现准确的热点话题。
【关键词】词项H指数 热点发现 微博话题 k-means
【基金】
【所属期刊栏目】情报科学
文献传递