标题
  • 标题
  • 作者
  • 关键词

多视图融合DJ-TextRCNN的古籍文本主题推荐研究

2024-01-24分类号:TP391.1;G255.1

【作者】武帅   杨秀璋   何琳
【部门】南京农业大学信息管理学院  武汉大学国家网络安全学院  贵州财经大学信息学院  
【摘要】传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT (bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN (DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准主题推荐,对中华文化深层次、细粒度的语义挖掘具有一定的指导意义。
【关键词】数字人文  古籍文本  主题推荐  多视图融合  DJ-TextRCNN
【基金】国家社会科学基金重大项目“先秦诸子典籍知识库建设及词典编纂”(22&ZD262)
【所属期刊栏目】情报学报
文献传递