标题
  • 标题
  • 作者
  • 关键词

机器学习与用户行为中的偏差问题:知偏识正的洞察

2023-05-05分类号:F274;TP181

【作者】郭迅华  吴鼎  卫强  陈国青  
【部门】清华大学经济管理学院  对外经济贸易大学信息学院  
【摘要】大数据环境下基于数智技术的管理决策广泛使用机器学习方法,利用用户行为数据以训练模型。然而,机器学习方法在数据使用和模型训练中不可避免地存在着模型偏差(包括数据观测和提取中的采样偏差以及模型构建中的拟合偏差);同时,在情境应用中,模型所做出的预测和推荐会对不同用户的感知、态度、行为选择和观点表达产生不同的影响,形成行为偏差(包括用户活动的选择偏差和行为表现的表达偏差)。一方面,行为偏差被带入到用户行为数据中,通过算法训练的过程被机器学习模型所习得,产生新的模型偏差;另一方面,模型偏差在系统应用中被输出,在情境交互中干扰用户的自选择及行动,引发新的行为偏差。这样的循环使得模型偏差和行为偏差往复重塑,在交互和习得过程中持续放大和扩散,不仅会导致模型算法的效力降低甚至失效,而且也会使得用户陷入有偏的信息环境,形成信息茧房等行为困境。在数字经济环境下,对于这些偏差问题的研究是各界关注的前沿课题。本文对机器学习和用户行为中的偏差问题及其循环影响进行了系统性的讨论,界定分析了其科学内涵、结构机理、性质特征、实践影响和管理意义,并对若干前沿研究和重要进展进行了梳理凝练,对相关偏差辨知和纠正策略进行了解析阐释,对未来研究方向和探索路径进行了前瞻展望。本文工作为信息系统乃至整个管理学领域的方法创新和赋能创新提供了一个互动的新视角,也为管理实践提供了理论与应用的启示。
【关键词】机器学习  用户行为  模型偏差  行为偏差  偏差循环
【基金】国家自然科学基金重大研究计划项目“大数据驱动的管理与决策研究重大研究计划战略研究项目”(基金号:91846000、92146006)的资助
【所属期刊栏目】管理世界
文献传递