融合XGBoost与SHAP的政务新媒体公共价值共识可解释性模型——以“今日头条”十大市级政务号为例
2022-08-31分类号:D63;G206
【部门】华中师范大学信息管理学院 华中师范大学中国图书馆创新发展研究中心
【摘要】[目的/意义]为准确识别影响公共价值共识的重要因素及其作用方式,提升政务新媒体广泛凝聚共识的能力和水平,提出一种融合XGBoost与SHAP的政务新媒体公共价值可解释性模型。[方法/过程]以“今日头条”下500篇政务头条号文章及32185条评论为研究对象。首先,识别文章的公共价值共识,并从内容、形式、情感3个维度提取文章特征变量,将预处理后的数据作为模型的输入。其次,构建基于XGBoost的政务新媒体公共价值共识预测模型,并与LR、SVM、LGBM等其他主流机器学习算法进行实验对比,找到综合最优模型。最后,引入SHAP解释框架,对各特征变量的重要性进行量化和归因。[结果/结论]结果发现,XGBoost模型在准确率、召回率、F1-score、AUC4项性能指标上均优于对比模型,性能优异。此外,文章主题类型、公共价值类型、文章长度、内容形式、文章情感属性、标题情绪符数量是影响政务头条号文章共识的重要特征,它们对公共价值共识的影响方式、影响方向和影响力度各有差异。
【关键词】公共价值共识 政务头条号 XGBoost SHAP 可解释性
【基金】国家社会科学基金重点项目“在线健康社区知识共创机理及引导机制研究”(项目编号:21ATQ006);; 华中师范大学2022年度基本科研业务费(自然科学类)优秀青年团队项目“信息交互行为与隐私保护研究”(项目编号:CCNU22QN017)研究成果之一
【所属期刊栏目】图书情报工作
文献传递