开放领域新闻中基于自适应决策边界的突发事件识别和分类研究
2022-09-06分类号:TP391.1;G210.7
【部门】重庆科技学院智能技术与工程学院 重庆科技学院图书馆
【摘要】[目的/意义]网络新闻是获取突发事件情报的重要来源之一,提高海量网络新闻中突发事件的识别准确率和分类效果,并减少非突发事件新闻造成的开放集识别问题和降低人工标注非突发事件新闻的成本,这是当前突发事件识别与分类研究的重要课题。[方法/过程]选择BERT预训练模型获得文本的特征表示,融合不同层级之间的语义信息增强文本表示的质量,采用自适应决策边界模型,学习各突发事件类别在高维语义表示空间上的球形最佳决策边界,根据新闻样本的文本表示和各突发事件类别的球形最佳决策边界的欧几里得距离,检测出突发事件新闻并判断突发事件的类别,并在CEC公开数据集和实时爬取的中文新闻数据集CEN上对模型的有效性进行验证。[结果/结论]实验结果表明,本文模型在CEC数据集和CEN数据集上的宏F1值分别为98.46%和95.80%,与基准模型相比,本文模型的宏F1值分别提升了5.15%和19.69%。模型应用展示了提出方法在解决实际问题时的有效性。[局限]未考虑突发事件新闻可能存在多标签的情况。
【关键词】突发事件 自适应决策边界 开放集识别 文本分类
【基金】国家社会科学基金西部项目“情报流程重构视角下的应急过程多目标优化研究”的成果,项目编号:19XTQ010
【所属期刊栏目】情报理论与实践
文献传递