面向查询的观点摘要模型研究:以Debatepedia为数据源
2020-04-24分类号:TP391.1;TP18
【部门】中南财经政法大学信息与安全工程学院 McKelvey School of Engineering Washington University in St.Louis 武汉大学信息管理学院
【摘要】本文系统性地研究面向查询的观点摘要任务,旨在构建一种查询式观点摘要模型框架,探究不同的摘要方法对摘要效果的影响。通过综合考虑情感倾向与句子相似度,从待检文档中抽取出待摘要语句,再结合神经网络和词嵌入技术生成摘要,进而构建面向查询的观点摘要框架。从Debatepedia网站上爬取议题和论述内容构建观点摘要实验数据集,将本文方法应用到该数据集上,以检验不同模型的效果。实验结果表明,在该数据集上,仅使用基于抽取式的方法生成的观点摘要质量更高,取得了最高的平均ROUGE分数、深度语义相似度分数和情感分数,较生成式方法分别提高6.58%、1.79%和11.52%,而比组合式方法提高了8.33%、2.80%和13.86%;同时,本文提出的句子深度语义相似度和情感分数评估指标有助于更好地评估面向查询的观点摘要模型效果。研究结果对于提升面向查询的观点摘要效果,促进观点摘要模型在情报学领域的应用具有重要意义。
【关键词】观点摘要 信息抽取 话语生成 情感分析 深度学习
【基金】国家自然科学基金面上项目“面向跨语言观点摘要的领域知识表示与融合模型研究”(71974202);国家自然科学基金重大课题“国家安全大数据综合信息集成与分析方法”(71790612)”
【所属期刊栏目】情报学报
文献传递