以生成式人工智能赋能思想史计算研究:模型构建与应用探索
2024-07-04分类号:B215;TP18
【部门】南京大学数据智能与交叉创新实验室 南京大学信息管理学院
【摘要】大语言模型改变了自然语言处理研究的模式。通过生成式自然语言处理,为史料计算化处理提供高效途径。以百川大模型作为基准模型,使用《思想家评传》系列丛书文本作为数据源,采用领域继续预训练、有监督微调、直接偏好优化的方法构建了思想家模型,并进行了性能评估。经过评估,思想家模型在中国思想史领域文本的表现优于通用模型,具有可用性。思想家模型降低了知识交流的专业壁垒,可以破解自然语言理解式计算人文研究带来的解读困境。
【关键词】计算史学 AIGC Thinkers 大语言模型 中国思想家评传 计算人文
【基金】江苏省研究生科研与实践创新计划项目“以生成式人工智能变革文献知识组织与评价研究”(项目编号:KYCX24_0111)的研究成果之一
【所属期刊栏目】图书馆杂志
文献传递