基于LDA模型的评论热点挖掘:原理与实现
2010-05-30分类号:TP391.1
【部门】上海理工大学管理学院
【摘要】本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。
【关键词】热点话题识别 热点挖掘 用户评论 模型
【基金】国家自然科学基金资助项目(项目编号:70903047); 上海市重点学科建设项目(项目编号:S30501,J50504); 上海市第三期本科教育高地建设项目(电子商务)的研究成果之一
【所属期刊栏目】情报理论与实践
文献传递