标题
  • 标题
  • 作者
  • 关键词

多层次融合的学术文本结构功能识别研究

2019-07-11分类号:G254

【作者】王佳敏  陆伟  刘家伟  程齐凯  
【部门】武汉大学信息管理学院  武汉大学信息检索与知识挖掘研究所  
【摘要】[目的/意义]学术文本结构功能是对学术文献的结构和章节功能的概括,针对当前研究较少从学术文本多层次结构出发进行融合和传统方法依赖人工经验构建规则或特征的问题,本文在对学术文本层次结构进行解析的基础上,构建了多层次融合的学术文本结构功能识别模型。[方法/过程]以ScienceDirect数据集为例进行实验,该模型首先通过深度学习方法对不同层次学术文本进行结构功能识别,接着采用投票方法对不同层次和不同模型的识别结果进行融合。[结果/结论]研究结果表明各层次集成后的整体效果较单一模型均有不同程度提升,综合结果的整体准确率、召回率和F1值分别达到86%、84%和84%,并且深度学习算法在学术文本分类任务中的性能较传统机器学习算法SVM更优,最后对学术文本结构功能错分情况进行了分析,指出本研究潜在的应用领域和下一步的研究方向。
【关键词】深度学习  结构功能  多层次融合  学术文本
【基金】国家自然科学基金面上项目“面向词汇功能的学术文本语义识别与知识图谱构建研究”(项目编号:71473183)研究成果之一
【所属期刊栏目】图书情报工作
文献传递