图模型框架下的报道性新闻自动摘要方法研究
2024-09-05分类号:TP391.1
【部门】中国农业科学院农业信息研究所 北京夏初科技集团有限公司 农业农村部农业大数据重点实验室
【摘要】[目的/意义]针对现有文本自动摘要形成过程中重要技术节点——图模型框架下摘要知识表达方式中内容语义揭示深度不够的问题,提出报道性新闻自动摘要模型方案,为相关领域利用经过摘要处理后的网页报道性新闻文本数据开展实践研究提供借鉴参考。[方法/过程]利用ETM(Embedded Topic Model)融合词向量的主题模型分析工具,在图模型框架下针对目标摘要句的主题构造环节,加入主题重要度特征和语义相关性特征并重新设计报道性新闻句间统计特征,对报道性新闻文本深层次主题语义信息进行挖掘、过滤,以此初步形成报道性新闻自动摘要抽取模型;后续依据报道性新闻摘要主要功能需求提出摘要主题测度功能量化指标体系,建立测度标准与句子统计特征量化方法的对应关系,以此优化调整提出的报道性新闻自动摘要抽取模型。[结果/结论 ]利用图模型框架下的报道性新闻自动摘要方法具体选取农业领域科技动态报道性新闻的摘要抽取过程进行实证,建立报道性新闻自动摘要测度标准进一步得到优化后报道性新闻摘要模型方案,结果显示在外部报道性功能及内部ROUGE评价测评综合表现上优于对比方法,可以有效提高报道性新闻自动摘要抽取的准确性。
【关键词】图模型 报道性新闻自动摘要 嵌入式主题模型 ROUGE评价
【基金】国家重点研发计划项目“科技文献内容深度挖掘及智能分析关键技术和软件”(项目编号:2022YFF0711900);; “中国农业科学院基本科研业务经费专项农业科技政策发展动向分析解读”(项目编号:Y2022ZK06)研究成果之一~~
【所属期刊栏目】图书情报工作
文献传递