标题
  • 标题
  • 作者
  • 关键词

网络舆情信息提取与预处理研究

2011-11-10分类号:TP391.1

【作者】陈桂鸿  曹树金  陈忆金  
【部门】深圳腾讯计算机科技有限公司  中山大学资讯管理学院  仲恺农业工程学院  
【摘要】本研究针对舆情信息源特征就舆情信息增量采集、提取和存储、文本信息预处理提出了基于Web-Harvest的定点信息采集以及基于输入法平台的新词收集策略,构建了一个互联网用语扩展词库,实现了信息预处理关键模块。
【关键词】网络舆情  信息提取  文本预处理  中文分词  句法分析
【基金】广东省教育厅产学研合作专项资金项目“网络舆情智能监测与分析系统”(2007A090302027)成果之一
【所属期刊栏目】图书情报知识
文献传递