标题
  • 标题
  • 作者
  • 关键词

文本分类特征降维研究综述

2011-05-05分类号:TP391.1

【作者】奉国和  郑伟  
【部门】华南师范大学经济管理学院信息管理系  河北北方学院理学院  
【摘要】特征降维是文本分类的关键技术之一,包括特征选择与特征抽取两类,其中特征选择按特征子集获取范围、特征子集搜索策略、特征子集评价策略等方式进行不同划分。归纳出当前特征选择与特征抽取所用的常用方法,分析各种方法的原理、指出每种方法的优势与不足,总结出相应改进算法。
【关键词】文本分类  特征降维  特征选择  特征抽取
【基金】国家社会科学基金项目“自动文本分类技术研究”(项目编号:08CTQ003); 河北北方学院自然科学青年基金项目“一种基于生成树文档聚类的KNN分类算法”(项目编号:Q2010008)研究成果之一
【所属期刊栏目】图书情报工作
文献传递