标题
  • 标题
  • 作者
  • 关键词

基于信息值的相关属性约减——加权二分类朴素贝叶斯算法研究

2018-02-08分类号:TP18

【作者】杨立洪  李琼阳  李兴耀  
【部门】华南理工大学数学学院  
【摘要】在经典的朴素贝叶斯分类算法中,往往假设各属性之间相互独立,且对目标变量的影响程度一致,但实际问题几乎不可能满足此假设。实际应用中的二分类问题最多,在二分类问题中考虑到属性相关、样本分布不平衡、各属性影响程度的不一致性对模型性能的影响,文章提出一种基于信息值的相关属性约减—加权二分类朴素贝叶斯模型,同时在判定样本类别归属时,采用自适应学习选择合适的阈值,以此削弱不平衡样本集的影响。实证结果表明,通过引入信息值,进行相关属性的约减—加权,模型结果在准确率上较之传统朴素贝叶斯算法有极大提升。
【关键词】信息值  属性约减  加权  二分类  贝叶斯算法  自适应
【基金】国家自然科学基金资助项目(11271140);; 广东省产学研协同创新成果转化项目(2016B090918041)
【所属期刊栏目】统计与决策
文献传递