标题
  • 标题
  • 作者
  • 关键词

基于条件随机场挖掘文本史料中事件信息的方法与实证研究——以《拉贝日记》数字人文研究为例

2023-05-26分类号:G275.1;G254

【作者】赵小萱  陈刚  黄紫荆  
【部门】南京大学地理与海洋科学学院  江苏省地理信息技术重点实验室  自然资源部国土卫星遥感应用重点实验室  
【摘要】文本史料被广泛数字化,如何从文本中提取地理命名实体及相关信息,有效开展地理信息挖掘成为重要研究课题。本文针对历史档案文档的特点,提出一种以地理命名实体为核心,使语义信息与地理位置关联,将文本描述的事件信息转化为各个地理命名实体的属性数据的事件抽取理念,提取出有关时间、地点、人物、事物、事件、现象等与地理命名实体相关的事件要素。研究以《拉贝日记》中收录的《日本士兵在南京安全区的暴行》档案为实证案例,采用条件随机场方法,抽取事件信息,结合历史地图等相关资料,将地理信息最终映射到地图上。本文方法拓展文本资料在数字信息时代的开发利用方式,开辟文本挖掘分析与知识发现的新思路。
【关键词】条件随机场  特征模板  数字人文  信息提取  地理命名实体
【基金】国家自然科学基金项目“基于近代地图的南京城市历史形态复原与景观变迁研究(1840~1937年)”(项目批准号:42071172);; 南京大学2021年“双创”项目“漫漫长夜中的人性之光:南京国际安全区故事地图(1937~1938)”研究成果之一
【所属期刊栏目】图书馆杂志
文献传递