基于BiLSTM-CRF模型的食品安全事件词性自动标注研究
2018-12-24分类号:TP391.1
【部门】武汉理工大学管理学院 武汉理工大学中国应急管理研究中心 南京大学信息管理学院
【摘要】词性自动标注的准确率和召回率直接影响到后续食品安全事件各个层面知识和应对策略挖掘的整体效果,不仅直接影响食品安全事件中术语、实体抽取的性能,而且在一定程度上决定了与食品安全事件相关的分类、聚类和关联知识挖掘的精准度。本文分别基于CRF、RNN、BiLSTM和BiLSTM-CRF等传统机器学习模型与深度学习模型对食品安全事件文本进行词性自动标注实验。四十组实验结果表明,在未加入任何人工特征的条件下,深度学习模型的标注调和平均值高于传统的条件随机场模型,其中RNN和BiLSTM的调和平均值分别高出了2.43%和3.93%。而有机融合了BiLSTM和条件随机场模型两者最优特征的BiLSTM-CRF模型整体性能达到了最优,其中调和平均值比BiLSTM高出了7.12%,并且其中最优模型的调和平均值达到了95.89%。
【关键词】词性标注 食品安全事件 深度学习模型 条件随机场模型
【基金】国家社会科学基金重大项目“基于情报流知识库的我国食品安全技术支撑体系优化策略研究”(15ZDB168);; 江苏省社会科学基金项目“江苏佛造像数字化保存及知识挖掘研究”(18TQB010)
【所属期刊栏目】情报学报
文献传递