标题
  • 标题
  • 作者
  • 关键词

面向数字人文的馆藏方志古籍地名自动识别模型构建

2018-05-21分类号:G255.1;K29

【作者】李娜  包平  
【部门】南京林业大学人文社会科学学院  南京农业大学中华农业文明研究院  南京农业大学信息科学技术学院  
【摘要】在数字人文背景下,以馆藏方志古籍为语料库,以摘抄自地方志的农业专题资料《方志物产》之山西分卷为例,在全文人工标注的基础上,构建基于条件随机场的古汉语地名自动识别模型,通过交叉验证方法测试模型的识别性能,用精确率P、召回率R和调和平均数F为测评指标,最佳的测试效果分别为98.16%、91.55%、94.57%。结果显示,条件随机场模型在基于人工标注的方志古籍语料上能够取得较好的识别效果,为深化图书馆馆藏古籍的整理利用提供借鉴。
【关键词】条件随机场  方志古籍  地名  馆藏资源
【基金】中央高校基本科研业务费资助校人文社科基金重大招标项目“方志内容挖掘及知识组织研究”(项目编号:SKZD201401);; 江苏省2015年度普通高校研究生科研创新计划项目“《方志物产》数字化整理研究——以山西分卷为例”(项目编号:KYZZ15_0172)研究成果之一
【所属期刊栏目】图书馆
文献传递