KNN分类算法改进研究进展
2012-11-05分类号:G353.1
【部门】华南师范大学经济与管理学院
【摘要】指出传统KNN(k-nearest neighbor)算法的两大不足:一是计算开销大,分类效率低;二是在进行相似性度量和类别判断时,等同对待各特征项以及近邻样本,影响分类准确程度。针对第一点不足,提出三种改进策略,分别为:基于特征降维的改进、基于训练集的改进和基于近邻搜索方法的改进;针对第二点不足,提出两种改进策略,分别为:基于特征加权的改进和基于类别判断策略的改进。对每种改进策略中的代表方法进行介绍并加以评述。
【关键词】KNN分类 特征降维 特征加权 训练集优化 快速算法
【基金】国家社会科学基金项目“自动文本分类技术研究”(项目编号:08CTQ003)研究成果之一
【所属期刊栏目】图书情报工作
文献传递