AI 학습 저작권 판결의 갈림길: 학습은 공정이용, 그러나 '해적판'은 별개
AI training copyright rulings 2026: fair use for training, but piracy liability remains
AI 학습데이터 저작권 소송의 윤곽이 2025~2026년 판결로 점차 잡혔다. Bartz v. Anthropic과 Kadrey v. Meta는 2025년 6월 이틀 간격으로 나왔는데, 둘 다 '저작물로 LLM을 학습시키는 행위 자체'는 공정이용(fair use)이 될 수 있다고 봤다. 법원은 저자가 학습용 라이선스 수익을 당연히 받을 권리가 있는 것은 아니며, 학습데이터 라이선스 시장은 저작권법이 보장하는 시장이 아니라고 판시했다. 그러나 두 판결은 두 지점에서 갈렸다 — 학습에 '해적판(pirated)' 콘텐츠를 쓴 것의 책임, 그리고 AI 산출물의 시장 잠식 효과를 손해 분석에 넣을지 여부다. 반면 Thomson Reuters v. Ross Intelligence(2025년 2월)는 헤드노트 복제가 공정이용이 아니라고 봤는데, 해당 AI가 저작권자의 상품과 직접 경쟁했다는 점(1·4 요소)이 결정적이었다. 즉 '학습은 공정이용일 수 있다'는 일반 면죄부가 아니며, 출력이 원저작물 시장을 직접 대체하면 판단이 뒤집힌다.
한국 개발자에게 시사점은 명확하다 — 학습 자체보다 '데이터를 어떻게 입수했는가'와 '산출물이 원저작물 시장을 대체하는가'가 위험의 핵심 축이다. 해적 코퍼스로 학습한 흔적은 별도 책임을 남기고, 원저작권자 상품과 직접 경쟁하는 출력은 공정이용 방어를 무너뜨린다. 라이선스된 데이터 확보와 출력의 비경쟁성(요약·변형) 설계가 곧 법적 방어선이다.
원문 출처
Reed Smith / Norton Rose Fulbright