数字人文视域下先秦典籍植物知识挖掘与组织研究
2023-06-20分类号:G250.7;G254
【部门】南京农业大学信息管理学院 人文与社会计算江苏省高校哲学社会科学重点研究基地 南京农业大学领域知识关联研究中心
【摘要】[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。
【关键词】数字人文 先秦典籍 植物命名实体 深度学习 知识图谱
【基金】国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(项目编号:21&ZD331);; 国家自然科学基金青年项目“基于深度学习的典籍引书知识图谱构建及应用研究”(项目编号:72004095)研究成果之一
【所属期刊栏目】图书情报工作
文献传递