标题
  • 标题
  • 作者
  • 关键词

基于主题的舆情跟踪方法研究及性能评价

2012-09-20分类号:TP391.1

【作者】姚长青  杜永萍  
【部门】中国科学技术信息研究所  北京工业大学计算机学院  
【摘要】舆情跟踪是对媒体信息流中的热点话题进行实时追踪,是近年来自然语言处理领域的研究热点。实现该任务的核心技术是进行文本分类,运用信息增益以及互信息计算特征项权重,提取向量空间模型中文档表示的有效特征;分别采用Rocchio、K-Nearest Neighbor(KNN)、Bayes方法对于给定主题的事件实现舆情跟踪。在测试集上的最优性能F-Measure值达到86.2%。舆情跟踪在信息安全等领域具有广阔的应用前景,为用户及时判断网络热点事件的发展趋势提供有效指导依据。
【关键词】舆情跟踪  文本分类  自然语言处理
【基金】国家自然科学基金青年基金项目“问答式信息检索中信息抽取技术研究”(项目编号:60803086); 北京市自然科学基金项目“语义蕴涵推理技术及在问答式信息检索中的应用研究”(项目编号:4123091)研究成果之一
【所属期刊栏目】图书情报工作
文献传递