搜索文献-EPS

年份

作者: 三(1); 东(1); 冯(1); 刘(1); 勤(1); 天(1); 张(1); 敏(1); 斌(1); 昊(1); 李斌(1); 波(1); 浏(1); 王(1); 胡(1); 萱(1); 逸(1); 邓(1); 鸿(1)

学科: 分类(1); 分类法(1); 法(1)

机构: 业大(1); 京(1); 京师(1); 信息(1); 信息管理(1); 农(1); 农业(1); 农业大学(1); 南京(1); 南京农业(1); 南京大(1); 南京大学(1); 南京师范大学(1); 大学(1); 学文(1); 学院(1); 师范(1); 师范大学(1); 文学(1); 文学院(1); 理学(1); 理学院(1); 管理(1); 管理学(1); 管理学院(1); 范(1)

基金

期刊: 书馆(1); 图书(1); 图书馆(1); 坛(1); 论坛(1)

全选本页取消本页

共检索到1条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

面向数字人文的《四库全书》子部自动分类研究——以Siku BERT和Siku Ro BERTa预训练模型为例

[期刊] 图书馆论坛 [作者] 胡昊天张逸勤邓三鸿王东波冯敏萱刘浏李斌

四库分类体系具有深远的影响。为解决古籍残本难以辨识所属类别问题，提供面向数字人文领域研究的方法工具，基于面向古文自然语言处理的Siku BERT和Siku Ro BERTa预训练语言模型，在《四库全书》子部14个类别的古籍文本上开展典籍自动分类模型的构建，并与BERT、BERT-wwm、Ro BERTa和Ro BERTa-wwm基线模型进行对比。文章提出的两种分类模型效果均优于基线模型，Siku BERT模型取得90.39%的整体分类F值，在天文算法类古籍上达98.83%的分类F值。在类别自动识别任务中，Siku Ro BERTa的预测正确率达95.30%。基于Siku BERT和Siku Ro BERTa预训练语言模型的四库自动分类体系可以有效的将典籍文本划分为所属子部类别，所构建的分类工具为高效自动化典籍分类提供了新的途径。

关键词：预训练模型 SikuBERT 文本分类数字人文《四库全书》子部

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

SikuBERT与SikuRoBERTa：面向数字人文的《四库全书》预训练模型构建及应用研究面向古籍数字人文的《资治通鉴》自动摘要研究——以SikuBERT预训练模型为例(9) 面向数字人文的先秦两汉典籍自动标点研究——以SIKU-BERT预训练模型为例面向数字人文的融合外部特征的典籍自动分词研究——以sikuBERT预训练模型为例面向数字人文的中国古代典籍词性自动标注研究——以SIKU-BERT预训练模型为例 ChpoBERT:面向中文政策文本的预训练模型《四库全书总目》与《四库采进书目》对证研究——以子部艺术类书法文献为例面向复杂认知技能的训练:四要素教学设计模型(4C/ID)述评《四库全书总目》研究述略情报学视角下的预训练语言模型研究进展