基于概率潜在语义分析和Adaboost算法的文本分类技术研究
2010-10-10分类号:TP391.1
【部门】中国人民大学统计学院 辅仁大学应用统计研究所
【摘要】文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
【关键词】文本自动分类 概率潜在语义分析(PLSA) Adaboost TEM迭代
【基金】
【所属期刊栏目】统计与决策
文献传递