标题
  • 标题
  • 作者
  • 关键词

基于高斯混合模型的林业信息文本分类算法

2014-07-01分类号:S711

【作者】陈宇  许莉薇  
【部门】东北林业大学信息与计算机工程学院  
【摘要】为解决传统林业信息文本分类算法准确率低和正确率分布不均匀的问题,提出了一种基于高斯混合模型的林业信息文本分类算法。在阐述高斯混合模型和EM算法的基础上,使用TF-IDF方法计算林业信息文本特征值,对构造的林业信息文本特征矩阵降维,结合Kmeans算法,通过训练得到各类林业信息文本所对应的高斯混合模型的参数,构造分类器进行精准与快速分类。实验结果表明,该算法与神经网络分类方法、贝叶斯、决策树等常用分类算法相比,该算法有较高的准确率和实用性,为林业信息文本的分类研究开拓了新思路。
【关键词】林业信息  文本分类  高斯混合模型  参数估计
【基金】国家948项目(2011-4-04); 中央高校基本科研业务费专项资金项目(DL12CB02); 黑龙江省教育厅科学技术研究项目(12513016); 黑龙江省博士后基金; 黑龙江省自然科学基金项目(F201347); 哈尔滨市科技创新人才专项资金项目(2013RFQXJ100)
【所属期刊栏目】中南林业科技大学学报
文献传递