基于动态权重的多模型集成水产动物疾病防治事件抽取方法
2023-04-26分类号:S941
【部门】大连海洋大学信息工程学院/辽宁省海洋信息技术重点实验室 设施渔业教育部重点实验室(大连海洋大学)
【摘要】为提高水产动物疾病防治事件抽取的准确性,有效解决抽取过程中出现的专有名词边界模糊和事件实体过长等问题,本研究将动态权重思想引入多模型集成的事件抽取方法中。改进后的方法利用百度自然语言理解开放平台(enhanced representation through knowledge integration,ERNIE)和澎湃BERT(MLM as correction BERT,MacBERT)2个预训练模型来学习文本语义信息;采用动态权重的gate模块融合特征;将学习到的语义信息传入双向长短时记忆网络(bi-directional long shortterm memory,BiLSTM)中,并通过条件随机场(conditionalrandomfield,CRF)对输出标签序列进行约束。选取ERNIE⊕MacBERT-CRF模型和ERNIE⊕MacBERT-BiLSTM-CRF模型(⊕代表简单相加求平均的融合方法)作为对照模型对提出的方法进行融合性能对比试验验证,结果显示,该方法 F1值达74.15%,比经典模型BiLSTM-CRF提高了20.02个百分点。结果表明,该方法用于水产动物疾病防治事件抽取具有更好的效果。
【关键词】水产动物疾病 事件抽取 ERNIE MacBERT 动态权重 健康养殖
【基金】设施渔业教育部重点实验室开放课题(2021MOEKLECA-KF-05);; 计算机体系结构国家重点实验室开放课题(CARCH201921);; 辽宁省教育厅高等学校基本科研项目面上项目(20220056);; 辽宁省教育科学“十四五”规划课题(JG21DB076)
【所属期刊栏目】华中农业大学学报
文献传递