标题
  • 标题
  • 作者
  • 关键词

基于大规模评论数据的产品特征词典构建方法研究

2018-01-25分类号:TP391.1

【作者】李伟卿  王伟军  
【部门】华中师范大学信息管理学院  华中师范大学青少年网络心理与行为教育部重点实验室  
【摘要】【目的】基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率。【方法】在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典。【结果】本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855。结果显示,该方法具有一定的普适性。【局限】标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征。【结论】通过与已有研究比较,验证了本文
【关键词】产品评论  特征词典  特征提取  观点挖掘
【基金】国家自然科学基金项目“基于屏幕视觉热区的网络用户偏好提取及交互式个性化推荐研究”(项目编号:71571084);国家自然科学基金项目“基于用户偏好感知的SaaS服务选择优化研究”(项目编号:71271099)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递