标题
  • 标题
  • 作者
  • 关键词

融合去噪技术和动态主题数的新闻话题分析框架研究

2018-04-04分类号:暂无

【作者】李湘东  阮涛  潘练  
【部门】武汉大学信息管理学院  武汉大学信息资源研究中心  
【摘要】【目的/意义】使用聚类技术在话题分析之前对文本集中的噪声文本进行识别筛查,并采用文档相似度分布及困惑度等对去噪和建模效果加以检验。【方法/过程】在提高文本集质量之后,借助LDA概率主题模型对新闻文本集进行话题抽取,通过计算相似度为不同时间窗口下的主题建立联系,挖掘热点话题及其演化规律。【结果/结论】将本方法应用于2014年度电商类新闻,得到的结果与同年度新华网经由人工评选出的电商热点新闻主题相比较,证明本方法的准确性。
【关键词】话题跟踪与分析  LDA模型  DBSCAN  噪声文本
【基金】
【所属期刊栏目】情报科学
文献传递