基于客户评论和语料库的在线酒店信誉维度挖掘
2012-06-20分类号:TP391.1
【部门】华中科技大学管理学院 湖北移动通信有限责任公司 河南信阳供电公司
【摘要】以携程网上消费者对酒店的文本评论为研究对象,通过对文本评论中的词语进行聚类,得到其中隐含的消费者最关注的酒店评价维度。为保证词语聚类的效果,引入语料库作为对比文档,通过分词、特征项表示、特征词编码标注、词义相似度计算以及基于DBSCAN的文本聚类过程,得到最后的评价维度,并以实例详细说明每个过程中所采用的方法及步骤。
【关键词】信誉维度 词语聚类 文本评论 词义相似度 语料库
【基金】国家自然科学基金项目“基于文本挖掘的在线零售商信誉评价模型研究”(项目编号:70871048)研究成果之一
【所属期刊栏目】图书情报工作
文献传递