标题
  • 标题
  • 作者
  • 关键词

基于OCC模型和LSTM模型的财经微博文本情感分类研究

2020-01-24分类号:F832.51;TP391.1;G254

【作者】吴鹏  李婷  仝冲  沈思  
【部门】南京理工大学经济管理学院  江苏省社会公共安全科技协同创新中心  
【摘要】为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。
【关键词】长短期记忆模型  OCC模型  财经微博  情感分类
【基金】国家自然科学基金项目“突发事件网民负面情感的模型检测研究”(71774084),“社会化影响下个体信息认知处理中的扭曲与偏见机制研究”(71471089);; 国家社会科学基金项目“基于社会网络分析的网络舆情主题发现研究”(15BTQ063)
【所属期刊栏目】情报学报
文献传递