标题
  • 标题
  • 作者
  • 关键词

健康信息画像构建及虚假健康信息识别:融合社会感知数据与发布者先验知识

2024-09-29分类号:R-05;G203

【作者】赵又霖   庞航远   石燕青
【部门】河海大学商学院  南京大学信息管理学院  南京农业大学信息管理学院  
【摘要】[目的/意义]融合包含丰富个体情感、行为和交互信息的社会感知数据和发布者先验知识有助于提高虚假健康信息识别精度。[研究设计/方法]基于社会感知数据,综合历史信息文本描述发布者对待检测信息的先验知识,并融合发布者先验知识,从发布者特征、内容特征和接收者行为特征3个维度提取健康信息特征;同时,建立健康信息画像,并基于Stacking集成学习模型构建虚假健康信息识别模型FHIR_SSD&PPK。[结论/发现] FHIR_SSD&PPK模型识别虚假健康信息的效果最好,准确率为92.35%;发布者特征的特征重要度占比总和最高,为51.59%,其中发布者先验知识特征的特征重要度为44.01%,并且与未考虑发布者先验知识的模型相比,F1值提升2.26%,说明本文提出的发布者先验知识是构建识别模型的关键特征。[创新/价值] FHIR_SSD&PPK模型融合社会感知数据和发布者先验知识,基于Stacking集成学习模型识别虚假健康信息,在细粒度和深度上对虚假健康信息识别研究进行了优化。
【关键词】健康信息画像  虚假健康信息  社会感知数据  先验知识  Stacking集成学习
【基金】中国博士后科学基金特别资助项目“面向应急管理的时空数据语义模型构建及创新应用机理研究”(2021T140311);中国博士后科学基金面上项目“环境污染突发事件的时空数据挖掘及协同治理机制研究”(2019M650108)的研究成果之一
【所属期刊栏目】图书情报知识
文献传递