标题
  • 标题
  • 作者
  • 关键词

基于提示学习的小样本文献分类方法

2023-06-20分类号:G254.1

【作者】安波  
【部门】中国社会科学院民族学与人类学研究所  
【摘要】文章研究学术文献分类中的长尾现象和新分类问题,提出基于提示学习的小样本文献分类方法,旨在实现低资源场景下的文献自动分类。借助大规模预训练语言模型的文本表示与生成能力,在提示学习框架下分析不同的提示模板、文献字段、文献类别表示、样本数等信息对低资源文献分类的影响。实验结果表明:通过合理的设计提示模板、文献类别表示、文献字段等信息,模型能高效实现低资源场景下的文献分类(50-shot的分类F1值约85%),是传统文献分类算法的重要补充;但在处理细粒度文献分类时存在分类错误问题,需要完善。
【关键词】小样本学习  提示学习  文献分类  预训练语言模型
【基金】国家社科基金项目“藏汉双语藏文古籍知识图谱构建研究”(项目编号:22BTQ010)研究成果
【所属期刊栏目】图书馆论坛
文献传递