标题
  • 标题
  • 作者
  • 关键词

基于BERT和分面分类的多标签的南海证据性数据分类研究

2022-01-24分类号:C932;G254.1

【作者】彭玉芳  石进  徐浩  杨海平  
【部门】南京工程学院经济与管理学院  南京大学信息管理学院  
【摘要】为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了南海文献分类法,应用Bert预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通过数据库技术将南海证据性数据分为12个面进行组配检索。通过以上方法赋予每一条南海证据性数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类。从更细粒度的视角,实现数据分类,与粗广式文献载体的分类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角是科学研究创新的基础和保障。
【关键词】BERT分面分类  数据分类  多标签分类  南海证据性数据
【基金】国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(项目编号:19ZDA347);; 南京工程学院校级科研基金创新基金面上项目Ⅰ“学术文献方法论知识驱动的跨学科知识扩散特征识别研究”(项目编号:CKJB202003);; 江苏省社科基金青年项目“融合在线学术社交信息的电子文献资源推荐策略研究”(编号:21TQC003)的研究成果之一
【所属期刊栏目】图书馆杂志
文献传递