基于最大信息系数的关联性特征选择算法:MICCFS
2023-12-13分类号:O212.1
【部门】湖北工业大学理学院
【摘要】针对基于关联性特征选择算法(CFS)对于回归任务只能识别变量线性关系和分类任务使用对称不确定性度量的不足,提出一种基于最大信息系数(MIC)的CFS特征选择算法:MICCFS.将回归任务中衡量变量间的线性相关系数和分类任务中的对称不确定性度量改进为MIC度量方式.运用最佳优先搜索算法搜索特征子集,以UCI机器学习数据库中11个回归数据集和10个分类数据集为实验对象,采用支持向量机、k近邻算法、朴素贝叶斯模型、决策树四种分类器,比较了MICCFS和CFS以及常用特征选择方法SVMRFE、Lasso、MIM、Relief F、Chi-Square的效果,结果表明MICCFS具有一定优势.
【关键词】关联性特征选择 最大信息系数 特征选择 分类 降维
【基金】国家自然科学基金青年项目(11701161);; 教育部人文社会科学基金项目(17YJA790098);; 湖北省教育厅人文社会科学重点项目(20D043);; 湖北工业大学博士启动基金项目(BSQD2020103)
【所属期刊栏目】华中师范大学学报(自然科学版)
文献传递