标题
  • 标题
  • 作者
  • 关键词

生成式AI训练数据的法律风险及其元规制

2024-09-15分类号:D922.17;D922.16;TP18

【作者】王海洋
【部门】西南政法大学博士后流动站  
【摘要】以ChatGPT为代表的生成式AI依托于海量的训练数据来实现模型的迭代升级,训练数据的质量和数量直接决定着生成式AI的性能和泛化能力。然而,训练数据本身潜藏着来源合法性、质量可信性、规模偏离性等风险,自我规制与政府规制路径都难以契合生成式AI的市场布局与更迭速度,亟须在包容审慎理念下对生成式AI训练数据予以元规制。在元规制理念下,国家通过规范引导模型研发者将经设计的数据保护与科技伦理理念内嵌于生成式AI的训练数据中,促成数据保护从利用环节延伸至研发环节,通过可信的数据来源、数据分类分级、数据影响评估等措施促成模型研发者自我观照式的内省,并经由数据保护的监管沙盒实现自我规制的规制。
【关键词】生成式AI  ChatGPT  训练数据  元规制
【基金】2023年度国家资助博士后研究人员计划“个人信息的整全性保护及其衔接机制研究”(GZC20232201)的阶段性成果
【所属期刊栏目】浙江社会科学
文献传递