标题
  • 标题
  • 作者
  • 关键词

基于全字语义的摘要结构功能自动识别研究

2019-01-24分类号:G254

【作者】沈思  胡昊天  叶文豪  王东波  
【部门】南京理工大学经济管理学院  南京农业大学信息科技学院  
【摘要】学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。
【关键词】全字语义  序列属性  摘要结构功能识别  LSTM-CRF
【基金】国家自然科学基金青年项目“基于时间感知模型的学术主题检索与演化挖掘研究”(71503124);国家自然科学基金青年项目“基于CSSCI的句法级汉英平行语料库构建及知识挖掘研究”(71303120)
【所属期刊栏目】情报学报
文献传递