基于词和实体标注的古籍数字人文知识库的构建与应用——以《资治通鉴·周秦汉纪》为例
2021-12-17分类号:G250.7;K204.3
【部门】南京师范大学文学院 复旦大学中国语言文学系 南京农业大学信息管理学院
【摘要】[目的/意义]探索能够实现基于词和实体的检索与知识挖掘的人文知识库构建方法。[方法/过程]以《资治通鉴·周秦汉纪》为例,对68卷60万字的文本自动分词与词性标注之后,人工标注文本中的人物、地点GIS、时间等实体信息,实现基于词和实体的全文检索和地图检索系统;利用同现信息,统计出人物关系与人物游历信息;进而使用TF-IDF方法,通过时间序列分析,挖掘出多事之秋、风云人物、风云之地等结果。[结果/结论]基于词和实体的深度信息标注,能够解决缺乏词界、同名异指和异名同指的检索难题,更可以为古籍多角度的知识发掘与知识服务提供基础支撑。
【关键词】《资治通鉴》 数字人文 知识挖掘 古籍检索 古文信息处理
【基金】江苏省社会科学基金项目“人工智能辅助青少年传统文化教育研究”(项目编号:20JYB004);; 国家社会科学基金项目“中文抽象语义库的构建及自动分析研究”(项目编号:18BYY127);国家社会科学基金重大项目“基于《汉学引得丛刊》的典籍知识库构建及人文计算研究”(项目编号:15ZDB127)研究成果之一
【所属期刊栏目】图书情报工作
文献传递