面向新闻领域的中文文本分类研究综述
2013-07-20分类号:TP391.1
【部门】南京理工大学信息管理系
【摘要】在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
【关键词】新闻分类 文本分类 机器学习 中文信息处理
【基金】江苏省社会科学基金项目“数字报纸的自动标引研究”(项目编号:09TQC011); 教育部人文社会科学研究项目“电子报纸内容深加工研究”(项目编号:09YJC870014)研究成果之一
【所属期刊栏目】图书情报工作
文献传递