采用LDA主题模型的多种类型文献混合自动分类研究
2015-01-10分类号:G254.1
【部门】武汉大学信息管理学院 武汉大学图书馆
【摘要】探索对多种类型文献进行混合分类组织时LDA主题模型的可行性及优越性。以图书、期刊、网页等不同类型的馆藏文献作为实验对象,分别采用LDA主题模型与VSM模型对实验材料进行建模,采用SVM算法实现文本混合自动分类。仿真实验表明:LDA主题模型相对VSM模型具有一定优势,混合自动分类准确率最大差距达19.9%;图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达72%以上。实验证明LDA主题模型对实现多种类型文献统一组织具有较高的可行性和适用性。
【关键词】LDA模型 混合分类 多种类型文献 数字图书馆
【基金】
【所属期刊栏目】图书馆论坛
文献传递