中文在线旅游评论的语言积极性偏见研究
2024-09-19分类号:H15;F592;F724.6
【部门】中山大学旅游学院 中山大学可持续旅游智能评测技术文化与旅游部重点实验室 吉首大学旅游学院 康奈尔大学建筑艺术与规划学院
【摘要】以旅游评论为代表的大数据的使用在当前旅游研究中日趋重要,但是与传统数据相比,非结构化的旅游评论数据是否能够客观地、无偏差地代表旅游者的内容与情感表达,是广大旅游研究学者尚未完全解决的难题。本文从旅游评论清洗校正问题入手,试图捕捉评论数据中语言积极性偏见(LPB)存在的方式与程度,并测定校正系数。本文在控制目的地、时间、情感属性、评分等重要变量的基础上,通过非参数检验方法分组检验语言积极性偏见现象,利用分位数回归方法揭示偏见系数的影响程度,采用bootstrap方法分组估算校正系数。结果表明:(1)语言积极性偏见在旅游情境中普遍存在;(2)偏见系数与分位段之间不存在线性相关关系。对于低分位(正负面词汇比例小于或等于1)的评论而言,评分对偏见系数影响微弱;反之,随着分位数的提升,评分对偏见系数的影响越明显。(3)偏见系数在不同地域、不同时间存在一定的差异,但程度较弱,其值基本稳定在[2.00,2.50]区间,不构成显著影响。本研究的发现是语言类大数据挖掘研究的一次有效推进,为数据清洗和智能处理提供了新的参考依据,同时也对语言心理学在语言情感表达偏差领域做出了积极的补充。
【关键词】文本大数据 乐观主义倾向 语言积极性偏见 旅游在线评论 情感分析
【基金】
【所属期刊栏目】旅游科学
文献传递