标题
  • 标题
  • 作者
  • 关键词

生成式人工智能训练数据的著作权法因应:确需设置合理使用规则吗?

2024-05-15分类号:G203;D923.41;TP18

【作者】魏远山
【部门】广东外语外贸大学法学院  
【摘要】[目的/意义]生成式人工智能(GenAI)训练数据包含大量尚处保护期的作品,明确是否应为机器学习设置合理使用规则,有助于化解GenAI训练数据的著作权法争议。[研究设计/方法 ]以类型化视角审视表达型和非表达型机器学习,以是否符合“未经许可利用作品训练GenAI构成侵权→遵循授权使用规则阻碍技术进步→其他简化授权机制无法适用”的逻辑来确定是否设置合理使用规则。[结论 /发现]作为非表达型机器学习的输入和训练阶段是“非作品性使用”,因不构成侵权自然无为其设置合理使用规则的必要;作为表达型机器学习的输出阶段是“作品性使用”,但因GenAI向公众开放前后所处场景有异,应作类型化分析。在未向公众开放时,GenAI输出结果主要用于验证模型训练情况,可被定性为合理使用;在向公众开放后,若输出结果对作品表达改动幅度超越改编行为范畴则属正当使用,反之则构成侵权。因输出阶段构成侵权不会阻碍GenAI技术发展,故无需为其设置合理使用规则。[创新/价值]与既有研究不同的分析方法和研究结论,对AI从业者和法律工作者探讨GenAI训练数据的著作权法问题具有启示作用,也对丰富和深化现有研究有益。关键词:生成式人工智能;机器学习;训练数据;著作权;合理使用;作品性使用
【关键词】生成式人工智能  机器学习  训练数据  著作权  合理使用  作品性使用
【基金】国家社会科学基金重大项目“总体国家安全观下产业知识产权风险治理现代化研究”(21&ZD204)的研究成果之一
【所属期刊栏目】图书情报知识
文献传递