可信机器学习综述
2024-04-15分类号:TP181
【部门】南京大学工程管理学院
【摘要】机器学习技术不断发展,在许多领域都有广泛的应用并展现出超出人类本身的能力。但机器学习方法利用不当或决策存在偏差,反而会损害人们的利益,特别是在一些敏感安全需求高的领域,如金融、医疗等,人们越来越重视机器学习的可信研究。目前,机器学习技术普遍存在一些缺点,如对代表性不足的群体存在偏见、缺乏用户隐私保护、缺乏模型可解释性、容易受到威胁攻击等。这些缺点降低了人们对机器学习方法的信任。尽管研究者已针对这些不足进行了深入探索,但缺乏一个整体的框架与方法系统地提供机器学习的可信分析。因此本文针对机器学习的公平性、可解释性、鲁棒性与隐私4个要素归纳总结了现阶段主流的定义、指标、方法与评估,然后讨论了各要素之间的关系,并结合机器学习全生命周期构建了一个可信机器学习框架。最后,给出了一些目前可信机器学习领域亟待解决的问题与面临的挑战。
【关键词】可信机器学习 公平性 可解释性 鲁棒性 隐私
【基金】国家自然科学基金优秀青年科学基金资助项目(12122107)
【所属期刊栏目】工业工程
文献传递