大语言模型对图书馆数字人文工作的挑战及应对思考
2023-10-13分类号:TP18;G250.7
【部门】上海图书馆
【摘要】大语言模型是人工智能在大规模预训练语料语言模型领域突破性的应用,给传统的知识理解、处理与服务带来了极大的挑战。文章通过文献调研和专家访谈,运用扎根理论从ChatGPT的数字人文工具价值,大语言模型中的汉语语料库,图书馆的汉语语料库建设工作,大语言模型带来的数据伦理四个方面对专家访谈资料进行内容分析,探讨大语言模型带给图书馆数字人文工作的挑战;基于文献、场景应用及专家见解,文章从数据确权及版权保护、语言文化的差异及偏见、技术应用边界,标准规范四个方面详述了图书馆数字人文工作实践的深层应对思考。
【关键词】大语言模型 ChatGPT 数字人文 数据伦理 语料库建设
【基金】国家社会科学基金重大项目“文化遗产智慧数据资源建设与服务研究”(项目编号:21&ZD334);; 中国索引学会规划重点课题“历史文献资源中的实体知识组织标准规范研究”(项目编号:CSI22A05)的研究成果之一
【所属期刊栏目】图书馆杂志
文献传递