基于DBSCAN算法与句间关系的热点话题发现研究
2017-06-20分类号:G254
【部门】长春理工大学图书馆 长春市农业信息中心
【摘要】[目的 /意义]在大数据时代面对海量的数据用户有时会束手无策。因此,越来越多的学者们开始关注互联网热点话题发现的算法,帮助用户快速获取热点话题。[方法 /过程]基于DBSCAN算法,通过动态调整参数来优化算法,实现热点话题发现。根据句法结构与句间关系分析构建热点话题过滤模型,过滤包含热点词项的一般话题。[结果 /结论]采用主流网站新闻数据集进行实验,利用错检率、漏检率等评价指标对算法的有效性进行检验,实验结果证明改进算法性能有所提升,能够为信息用户提供科学研究网络数据的高效途径。
【关键词】信息用户 热点话题 聚类分析 句法结构 句间分析
【基金】
【所属期刊栏目】图书情报工作
文献传递