标题
  • 标题
  • 作者
  • 关键词

融合学习扩展的非遗陶瓷工艺领域术语库构建及应用

2023-07-31分类号:J527;G254

【作者】汪琳  王昊  李晓敏  邓三鸿  
【部门】南京大学信息管理学院/江苏省数据工程与知识服务重点实验室  
【摘要】文章通过学习扩展的机器学习和深度学习,提出针对非物质文化遗产项目语料的术语抽取及新词发现方法,形成领域术语库并探讨在数字人文领域的应用。首先使用自然语言处理方法对非遗陶瓷语料进行预处理,结合领域术语词表对语料进行标注;然后针对Random-CRFs模型,研究词表特征(DICT)、词性特征(POS)、部首特征(Radical)、拼音特征(Pinyin)等4个特征对术语抽取效果的影响,再对比Random-CRFs、Random-BiLSTM、Random-BiLSTM-CRFs、BERT-BiLSTM-CRFs等4个模型对术语抽取效果的影响;最后使用训练完成的模型对测试集语料进行新词识别,对抽取出的候选词进行人工判断,构建包含1137个术语的非物质文化遗产陶瓷工艺领域术语库,将其应用于非遗项目画像、非遗陶瓷工艺知识图谱和非遗陶瓷工艺术语检索。
【关键词】非物质文化遗产  领域术语  新词发现  数字人文
【基金】国家自然科学基金“关联数据驱动下我国非遗文本的语义解析与人文计算研究”(项目编号:72074108);; 中央高校基本科研业务费项目“面向人文计算的方志文本的语义分析和知识图谱研究”(项目编号:010814370113)研究成果
【所属期刊栏目】图书馆论坛
文献传递