注入图情领域知识的命名实体识别模型
2022-08-30分类号:TP391.1
【部门】广东外语外贸大学信息科学与技术学院 清华大学计算机科学与技术系 北京信息科学与技术国家研究中心 中山大学信息管理学院
【摘要】命名实体分类和识别是自然语言处理中的关键任务,识别效果将会影响许多下游任务的性能。本文基于现有知识图谱,提出了图情领域9大类实体,并构建了适用于图情领域实体识别的LISERNIE模型。通过开展广泛的实验,结果表明,在预训练阶段注入了图情领域知识的LISERNIE模型能有效识别出命名实体,并且在小规模标注数据集上具有明显的性能优势,在应用到后续的开放域关系抽取实验中,其准确率远高于CORE系统,为进一步构建如知识图谱、问答系统、机器阅读等提供数据支撑。
【关键词】命名实体识别 知识图谱 预训练语言模型 领域知识
【基金】国家社会科学基金一般项目“基于深度学习的学科领域网络学术情报发现研究”(项目编号:18BTQ065);; 中国博士后面上资助项目“复杂任务下基于用户相关性反馈的会话搜索优化研究”(项目编号:2021M691823)和广州市科技计划项目“基于深度学习的软件漏洞挖掘方法研究”(项目编号:202201010100)研究成果
【所属期刊栏目】图书馆论坛
文献传递