基于引文—主题概率模型的科技文献主题识别方法研究
2013-09-30分类号:TP391.1
【部门】北京城市学院信息学部 中国科学院国家科学图书馆
【摘要】海量的科技文献中蕴含着大量揭示学科内容的主题信息。文章提出了一种新的概率模型:引文—主题概率模型,该模型对文献中的关键词和引文进行联合建模以完成科技文献中的主题内容识别,在获得主题中关键词分布的同时也获得相关主题间的引文分布。实验表明,基于引文—主题模型识别的主题信息能为进一步的主题演化分析提供一定的分析基础。
【关键词】科技文献 主题识别 引文—主题模型 方法研究
【基金】
【所属期刊栏目】情报理论与实践
文献传递