网络舆情信息提取与预处理研究
2011-11-10分类号:TP391.1
【部门】深圳腾讯计算机科技有限公司 中山大学资讯管理学院 仲恺农业工程学院
【摘要】本研究针对舆情信息源特征就舆情信息增量采集、提取和存储、文本信息预处理提出了基于Web-Harvest的定点信息采集以及基于输入法平台的新词收集策略,构建了一个互联网用语扩展词库,实现了信息预处理关键模块。
【关键词】网络舆情 信息提取 文本预处理 中文分词 句法分析
【基金】广东省教育厅产学研合作专项资金项目“网络舆情智能监测与分析系统”(2007A090302027)成果之一
【所属期刊栏目】图书情报知识
文献传递