基于动态LDA主题模型的内容主题挖掘与演化
2014-02-28分类号:G202
【部门】武汉大学信息资源研究中心
【摘要】指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。
【关键词】主题挖掘 主题演化 动态LDA模型
【基金】教育部人文社会科学青年基金项目“社会网络环境下信息内容主题挖掘与语义分类研究”(项目编号:13YJC870008); 国家自然科学青年基金项目“社会网络环境下基于用户-资源关联的信息推荐研究(项目编号:71303178)”研究成果之一
【所属期刊栏目】图书情报工作
文献传递