基于集成算法的SVM训练数据选择
2018-05-11分类号:F224
【部门】西安电子科技大学数学与统计学院
【摘要】当训练数据集非常大的时候,支持向量机在训练阶段所需的时间及空间复杂度非常高。为了降低支持向量机训练的时间及空间复杂度,文章提出一种新的支持向量机训练数据选择方法,叫做随机分组抽样集成法。该方法首先用随机分组抽样技术来选择基分类器的训练样本,从而保证了基分类器的训练样本是没有重复的。然后将所有的基分类器进行组合,根据集成规则来选择支持向量机的训练数据。仿真结果表明,该方法在保证支持向量机分类精度的前提下,大大降低了其训练的时间复杂度。同时也降低了数据选择过程的时间复杂度。
【关键词】基分类器 抽样方法 数据选择 支持向量机 大数据
【基金】国家自然科学基金资助项目(61573266)
【所属期刊栏目】统计与决策
文献传递