标题
  • 标题
  • 作者
  • 关键词

面向数字人文研究的大规模古籍文本可视化分析与挖掘

2016-03-01分类号:G255.1;G353.1

【作者】欧阳剑  
【部门】上海师范大学语言研究所  广西民族大学图书馆  
【摘要】传统的古籍开发与应用模式已难以适应人文学科研究的需要,人文学科研究者期待一个技术逻辑和人文逻辑相耦合的数字人文研究范式的出现。本文从古籍文献深层次开发与利用出发,利用新的信息技术与面向数字人文研究跨学科方法,以大规模中国古籍文本为研究对象,采用大数据研究理念,对古籍进行整理、标注、自动分词等处理,以词频分析统计为研究核心,采用数据降噪、基于窗口时间单位的统计分析计算、滑动窗口预测等分析与挖掘方法,采用大数据实时分析技术,实现了实时、在线、立体、可视化、定量分析字词的历史词频分布规律,创建了一个以语言学、历史文献学、历史地理学等人文学科研究为主的古籍实时统计分析平台,可辅助研究者在大量的古籍文献...
【关键词】数字人文  文本可视化  数据挖掘  古籍文献
【基金】
【所属期刊栏目】中国图书馆学报
文献传递