基于局部线性判别嵌入算法的中文文本分类研究
2014-02-28分类号:TP391.1
【部门】中国科学院国家科学图书馆兰州分馆 中国科学院资源环境科学信息中心 中国科学院大学 曲阜师范大学信息技术与传播学院
【摘要】流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
【关键词】流形学习 文本分类 算法
【基金】
【所属期刊栏目】情报理论与实践
文献传递