标题
  • 标题
  • 作者
  • 关键词

基于句法结构的政策文本摘要生成模型研究

2024-06-12分类号:D63;TP391.1

【作者】胡吉明   杨云
【部门】武汉大学信息管理学院  武汉大学数据智能研究院  国家自然科学基金委员会管理科学部  
【摘要】[目的/意义]为缓解政策信息过载、提高政策阅读效率及提升政策作用发挥效果,对政策文本的核心信息进行汇总凝练并生成高质量摘要。[方法/过程]集成无监督模型和算法,提出基于句向量改进的政策文本关键句子抽取策略;将依存句法结构融合至政策文本摘要生成中,提取政策文本依存句法树及其依存句法特征,增强基于RoBERTa模型的政策文本表示效果;在基于Seq2Seq的政策文本摘要生成模型中,引入PGN模型和改进SIMCLS模型筛选出最佳候选摘要,提升模型性能与所生成摘要的质量。[结果/结论]针对国务院政策文本的摘要生成实验表明,研究构建的融合关键句子和依存句法的政策文本摘要模型与策略,在ROUGE指标的评价上显著优于其他模型,且从实例呈现上看,模型所生成摘要在语义和语言质量上均表征良好。但政策文本摘要生成的连贯性有待提升,用于学习训练的、适用的参考摘要较少,摘要生成的评价评估有待进一步完善。
【关键词】政策文本  摘要生成  关键句抽取  依存句法  国务院政策
【基金】国家社会科学基金一般项目“基于结构功能的政策文本摘要生成研究”(项目编号:23BTQ081);; 武汉大学社会科学数智创新研究项目团队;武汉大学人文社会科学青年学术团队项目“政策智能推理研究”(项目编号:00030374);; 国家自然科学基金面上项目“基于深度学习的政务新媒体互动内容摘要自动生成与情感分析模型研究”(项目编号:71874125)的成果
【所属期刊栏目】情报理论与实践
文献传递