标题
  • 标题
  • 作者
  • 关键词

融合语义联想和BERT的图情领域SAO短文本分类研究

2021-08-20分类号:G254.1;TP391.1

【作者】张玉洁  白如江  刘明月  于纯良  
【部门】山东理工大学信息管理研究院  烟台大学图书馆  
【摘要】[目的/意义]针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程]以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论]在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。
【关键词】SAO  短文本分类  语义联想  BERT
【基金】山东省高等学校青创科技支持计划“科技大数据驱动的智慧决策支持创新团队-面向新旧动能转换的新兴科学研究前沿识别研究”(项目编号:2019RWG033);; 山东省社科规划处项目“数字环境下科学论文的内容标注模型研究”(项目编号:20CSDJ65)研究成果之一
【所属期刊栏目】图书情报工作
文献传递