以生成式人工智能赋能思想史计算研究：模型构建与应用探索

2024-07-04分类号：B215;TP18

【作者】刘江峰张冉张君冬裴雷

【部门】南京大学数据智能与交叉创新实验室南京大学信息管理学院

【摘要】大语言模型改变了自然语言处理研究的模式。通过生成式自然语言处理，为史料计算化处理提供高效途径。以百川大模型作为基准模型，使用《思想家评传》系列丛书文本作为数据源，采用领域继续预训练、有监督微调、直接偏好优化的方法构建了思想家模型，并进行了性能评估。经过评估，思想家模型在中国思想史领域文本的表现优于通用模型，具有可用性。思想家模型降低了知识交流的专业壁垒，可以破解自然语言理解式计算人文研究带来的解读困境。

【关键词】计算史学 AIGC Thinkers 大语言模型中国思想家评传计算人文

【基金】江苏省研究生科研与实践创新计划项目“以生成式人工智能变革文献知识组织与评价研究”(项目编号：KYCX24＿0111)的研究成果之一

【所属期刊栏目】图书馆杂志

文献传递