标题
  • 标题
  • 作者
  • 关键词

利用新词探测提高中文微博的情感表达抽取

2017-01-15分类号:TP391.1

【作者】万琪  于中华  陈黎  宋磊磊  丁革建  
【部门】四川大学计算机学院  浙江师范大学数理与信息工程学院  
【摘要】情感表达抽取工作是细粒度情感挖掘的重要任务之一.中文微博中包含大量网络新词和不规范词,现有的方法在进行微博情感表达抽取任务时不能很好地处理上述情况.通过研究发现,微博中新词大量分布在文本的情感表达部分,于是提出了基于CRF的联合抽取模型,即将新词发现融入到情感表达抽取任务中,从而改进原有工作的不足.实验结果表明,新词探测对微博文本情感表达抽取有很好的指示作用,在电影领域和开放领域的微博数据集上分别进行实验,F1值均提高了2%以上.
【关键词】情感分析  新词发现  条件随机场  信息抽取
【基金】四川省科技支撑项目(2014GZ0063);; 浙江省自然科学基金(LY12F02010)资助
【所属期刊栏目】中国科学技术大学学报
文献传递