标题
  • 标题
  • 作者
  • 关键词

基于机器学习的自动文摘研究综述

2014-09-20分类号:TP181

【作者】曹洋  成颖  裴雷  
【部门】南京大学信息管理学院  
【摘要】探讨基于机器学习的自动文摘研究中的特征选取、算法选择、模型训练、文摘提取和模型评测等主要过程;重点分析3种主要的机器学习算法:朴素贝叶斯、隐马尔科夫和条件随机场,阐释3种算法的基本思想,在对相关研究进行系统梳理的基础上,给出作者的思考;对3种机器学习算法在训练方法、协同训练与主动学习、类别平衡以及词汇分布等方面存在的共性问题进行深入讨论并提出未来的主要研究方向。
【关键词】自动文摘  机器学习  NB  HMM  CRF
【基金】国家社会科学基金重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究”(项目编号:12&ZD221); 国家自然科学基金项目“融合范式视角下的链接分析理论集成框架及其实证研究”(项目编号:71273125)研究成果之一
【所属期刊栏目】图书情报工作
文献传递