标题
  • 标题
  • 作者
  • 关键词

中文微博作者身份识别研究

2017-01-24分类号:TP391.1;TP393.092

【作者】祁瑞华  郭旭  刘彩虹  
【部门】大连外国语大学软件学院  
【摘要】本文针对中文微博篇幅短小、无间隔标记等特点,建立了由词汇特征、浅层句法和深层句法特征集组成的中文微博作者文体特征模型,选取支持向量机、序列最小优化支持向量机、朴素贝叶斯和决策树算法在公开微博语料上进行算法对照实验、特征集组合实验和各组文体特征的作者身份识别实验。实验结果验证了本文模型在中文微博作者身份识别任务中的高准确率、召回率和时间效率。
【关键词】中文  微博  作者身份识别
【基金】国家社会科学基金一般项目(15BYY028);; 国家教育部回国人员科研启动基金(教外司[2015]1098);; 教育部人文社科青年基金项目(11YJCZH131);; 大连外国语大学科研项目(2013XJQN20,2014XJQN15)
【所属期刊栏目】情报学报
文献传递