基于主题过滤与主题关联的学科主题演化分析
2018-01-25分类号:G254
【部门】南京大学信息管理学院 烟台大学图书馆
【摘要】【目的】针对采用LDA模型识别出的主题中往往含有一些无意义的主题,严重影响演化分析的精确性问题,本文提出采用主题过滤和主题关联的方式,构建学科主题在时间序列上的演化路径,并分析主题在内容上的演化情况。【方法】计算主题在所有文献中出现的概率,识别并过滤边缘主题;根据主题中词汇分布的倾向性,识别并过滤无意义的噪音主题。将过滤后的主题作为主题演化分析的主题,通过计算相邻时间段中主题间的JS散度识别相关主题,从而根据主题间的相关关系构建主题演化路径。【结果】以"机器学习"领域的文献为例,构建学科主题演化路径,展示
【关键词】学科主题演化 主题过滤 LDA主题模型 演化分析
【基金】国家社会科学基金重点项目“基于关联数据的学术文献内容语义发布及其应用研究”(项目编号:17ATQ001)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递