基于信息值的相关属性约减——加权二分类朴素贝叶斯算法研究
2018-02-08分类号:TP18
【部门】华南理工大学数学学院
【摘要】在经典的朴素贝叶斯分类算法中,往往假设各属性之间相互独立,且对目标变量的影响程度一致,但实际问题几乎不可能满足此假设。实际应用中的二分类问题最多,在二分类问题中考虑到属性相关、样本分布不平衡、各属性影响程度的不一致性对模型性能的影响,文章提出一种基于信息值的相关属性约减—加权二分类朴素贝叶斯模型,同时在判定样本类别归属时,采用自适应学习选择合适的阈值,以此削弱不平衡样本集的影响。实证结果表明,通过引入信息值,进行相关属性的约减—加权,模型结果在准确率上较之传统朴素贝叶斯算法有极大提升。
【关键词】信息值 属性约减 加权 二分类 贝叶斯算法 自适应
【基金】国家自然科学基金资助项目(11271140);; 广东省产学研协同创新成果转化项目(2016B090918041)
【所属期刊栏目】统计与决策
文献传递