广告虚假好评和返利虚假好评的识别:兼有情绪与文本双重特征的模型框架
2024-08-08分类号:F713.8;F724.6;TP391.1
【部门】中国矿业大学(北京)管理学院 中国地质大学(北京)经济管理学院
【摘要】在线商品广告虚假好评和返利虚假好评干扰了数字经济的良性发展。本文目的是建立兼有情绪与文本双重特征的模型框架,以识别两类虚假好评和真实好评。通过网络爬虫收集真实评论,依据对评论撰写者的调研实践提取标注规则,建立两类虚假好评与真实好评的中文数据集。引入PAD情绪理论解构评论蕴含的情绪,结合情绪强化调节影响,构造评论的情绪特征。利用n-gram分词和TF-IDF向量化评论文本,运用Boruta方法构建多维文本特征。采用18种主流分类算法构建多类好评的分类模型。实验与对比分析显示:两类虚假好评与真实好评在情绪强化调节影响分布与PA D三维度上存在显著差异,据此提出一种评价好评情绪的可行建模方法 ;提取的情绪与文本特征使得分类算法均可有效识别三类好评,体现所构建模型框架对分类算法的较低依赖性;引入多维情绪特征能够显著提升分类算法对三类好评,尤其可增强对隐蔽性较强的返利虚假好评的辨识力,体现情绪特征对文本特征的增益效果。本研究结论为电商平台改进虚假好评过滤机制与消费者识别两类虚假好评提供参考借鉴。
【关键词】广告虚假好评 返利虚假好评 真实好评 情绪理论 评论文本
【基金】中国矿业大学(北京)越崎青年学者项目(800015Z11A21);; 中央高校基本科研业务费项目(590121047);; 国家自然科学基金项目(71972177)资助
【所属期刊栏目】南开管理评论
文献传递