基于RoBERTa和LightGBM的中文图书采选模型研究
2024-08-02分类号:TP181;G253.1
【部门】厦门大学图书馆 厦门大学经济学院
【摘要】在对智能图书采选模型构建方法进行综述和对相关机器学习算法进行介绍基础上,探索基于RoBERTa和LightGBM构建高校图书馆中文图书采选机器学习模型。分析模型的构建目标和研究框架,从数据来源与清洗、特征筛选与确定、衍生特征构建、基于RoBERTa模型的文本特征构造、数据编码等方面对特征工程进行详细描述,构建基于LightGBM的中文图书采选分类模型并进行模型评估,提出模型应用策略方案和后续研究建议,以期推进机器学习模型的应用发展和图书采选工作的智能化转型。
【关键词】高校图书馆 图书采访 机器学习模型 RoBERTa LightGBM
【基金】福建省社会科学基金项目(项目批准号:FJ2023B111)的研究成果之一
【所属期刊栏目】大学图书馆学报
文献传递