- 年份
- 机构
- 业大(1)
- 京(1)
- 京师(1)
- 信息(1)
- 信息管理(1)
- 农(1)
- 农业(1)
- 农业大学(1)
- 南京(1)
- 南京农业(1)
- 南京大(1)
- 南京大学(1)
- 南京师范大学(1)
- 大学(1)
- 学文(1)
- 学院(1)
- 师范(1)
- 师范大学(1)
- 文学(1)
- 文学院(1)
- 理学(1)
- 理学院(1)
- 管理(1)
- 管理学(1)
- 管理学院(1)
- 范(1)
- 基金
共检索到1条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆论坛
[作者]
胡昊天 张逸勤 邓三鸿 王东波 冯敏萱 刘浏 李斌
四库分类体系具有深远的影响。为解决古籍残本难以辨识所属类别问题,提供面向数字人文领域研究的方法工具,基于面向古文自然语言处理的Siku BERT和Siku Ro BERTa预训练语言模型,在《四库全书》子部14个类别的古籍文本上开展典籍自动分类模型的构建,并与BERT、BERT-wwm、Ro BERTa和Ro BERTa-wwm基线模型进行对比。文章提出的两种分类模型效果均优于基线模型,Siku BERT模型取得90.39%的整体分类F值,在天文算法类古籍上达98.83%的分类F值。在类别自动识别任务中,Siku Ro BERTa的预测正确率达95.30%。基于Siku BERT和Siku Ro BERTa预训练语言模型的四库自动分类体系可以有效的将典籍文本划分为所属子部类别,所构建的分类工具为高效自动化典籍分类提供了新的途径。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除
推荐搜索
SikuBERT与SikuRoBERTa:面向数字人文的《四库全书》预训练模型构建及应用研究
面向数字人文的先秦两汉典籍自动标点研究——以SIKU-BERT预训练模型为例
面向数字人文的中国古代典籍词性自动标注研究——以SIKU-BERT预训练模型为例
面向古籍数字人文的《资治通鉴》自动摘要研究——以SikuBERT预训练模型为例(9)
面向数字人文的融合外部特征的典籍自动分词研究——以sikuBERT预训练模型为例
ChpoBERT:面向中文政策文本的预训练模型
《四库全书总目》与《四库采进书目》对证研究——以子部艺术类书法文献为例
面向复杂认知技能的训练:四要素教学设计模型(4C/ID)述评
融合预训练和深度学习的图书功用分类研究
情报学视角下的预训练语言模型研究进展