标题
  • 标题
  • 作者
  • 关键词

时间维度下的史籍全文自动重组研究——数字人文视角下的探索

2022-01-10分类号:G250.7

【作者】张琪  王东波  黄水清  李斌  孟凯  邓三鸿  
【部门】南京大学信息管理学院  江苏省数据工程与知识服务重点实验室  南京农业大学信息管理学院  南京师范大学文学院  南京农业大学马克思主义学院  
【摘要】[目的/意义]本文从数字人文的视角出发,试图探究一套具体的技术方法解决古汉语时间描述所存在的省略、共指、歧义、模糊等问题,使得读者可以跨越纪传体、国别体、纪事本末体等体裁壁垒,获取不同史书中关于某一时间段的所有史料。[研究设计/过程]在梳理古汉语时间描述类型与特征的基础上,提出一套以时间为线索自动重组史书全文的方法。该方法首先识别古汉语时间描述并进行语义解析,继而识别事件句并将事件句关联至时间描述,最后将提出的方法应用于纪传体史书《史记》和国别体史书《国语》的重组中,检验方法的有效性。[结论/发现]本研究所提出的方法能够有效实现纪传体、国别体史书以时间为线索的重组问题,在有效减少人工标注的前提下达到了较高的准确率。[创新/价值]针对古汉语时间描述存在的歧义与共指等问题,提出一套完整的以时间为线索自动重组史书全文的方法,并通过实验验证了方法的有效性。
【关键词】数字人文  史书  古汉语时间信息处理  古汉语时间表达式消歧  事件时间语义关联
【基金】国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(21&ZD331);; 国家自然科学基金面上项目“基于典籍引得的句法级汉英平行语料库构建及人文计算研究”(71673143)的研究成果之一~~
【所属期刊栏目】图书情报知识
文献传递