基于主题模型(LDA)的查新辅助分析系统设计研究
2018-02-15分类号:G252.7;TP311.52
【部门】合肥学院图书馆 中国科学技术大学图书馆
【摘要】文章概述了主题概率模型(LDA)的计算原理和方法,以及开源R语言中lda程序包采用快速压缩吉普抽样算法分析语料库的处理流程。设计了基于LDA模型的查新辅助分析系统设计功能框架,对其功能、编程实现思路和工作流程做了描述。最后结合课题查新实例,详述了采用LDA模型通过相关文献关键词进行潜在主题挖掘,对比分析课题研究内容,对课题给出客观评价的过程。结果表明,基于主题模型的查新辅助分析系统可以快速有效挖掘相关文献主题,降低查新员对相关文献的分析难度,提高课题评价的客观性,整体辅助分析效果良好。
【关键词】主题模型 R语言 查新 课题评价
【基金】安徽高校人文社会科学研究重点项目“基于泛在学习需求的图书馆空间智能服务研究”(项目编号:SK2017A0606);; 安徽高校自然科学研究重点项目“基于上下文相关性的网络编码可靠多播技术的研究”(项目编号:KJ2016A609)
【所属期刊栏目】现代情报
文献传递