基于全字语义的摘要结构功能自动识别研究
2019-01-24分类号:G254
【部门】南京理工大学经济管理学院 南京农业大学信息科技学院
【摘要】学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。
【关键词】全字语义 序列属性 摘要结构功能识别 LSTM-CRF
【基金】国家自然科学基金青年项目“基于时间感知模型的学术主题检索与演化挖掘研究”(71503124);国家自然科学基金青年项目“基于CSSCI的句法级汉英平行语料库构建及知识挖掘研究”(71303120)
【所属期刊栏目】情报学报
文献传递