자세히보기

Business News & Law

클로드 AI 저작권 소송 승리(?) AI기업들이 반드시 알아야 할 내용 정리!

BNL Law 2025. 7. 18. 16:01

최근 Claude AI 제작사 Anthropic AI 데이터 관련 소송에서 승소하였다는 소식이 전해졌습니다

 

본 결정은 향후 AI 기업들에게 매우 중요한 영향을 미칠 수 있는 결정이고, 한편으로 이게 반드시 클로드 AI의 승리인가 하는 의문이 드는 점도 있습니다.

 

이에 본 판결의 내용을 설명해드리고 AI 기업들이 향후 유의하실 점에 대해 말씀드리겠습니다.

장건 변호사(한국/미국)

 

BNL Law

>>  Comprehensive Legal Services for Corporate Establishment in Korea and the USA: Investment Structure Advisory, Foreign Exchange Reporting, Document Preparation, Business Registration, Bank Account Setup, Licensing and Permits, and Practical Training fo

en.bnl.legal

상담신청: https://www.bnl.legal/contacts

기타문의: official@bnl.legal

 

사건 개요

3명의 작가(Andrea Bartz, Charles Graeber, Kirk Wallace Johnson)는 2024년 집단 소송을 제기하면서, Claude AI의 제작사인 Anthropic이 자신들의 저작물을 불법적으로 입수해 AI 훈련에 사용했다고 주장했습니다.

 

판결문에 의하면 Anthropic은 약 700만권에 달하는 온라인 도서들을 저작권자의 동의 없이 다운로드 하였고, 수백만권의 종이책들을 실제로 구매하여 스캔하는 방식으로 디지털화하여 일종의 "Library"를 만들었습니다.

 

그리고 Anthropic은 위 Library를 이용하여 특정한 LLM을 학습시키는데에 사용하였습니다. 

 

캘리포니아 북부지방법원의 윌리엄 알섭(William Alsup) 판사는 2025년 6월 위 사건에 대해 원고의 일부 승소 판결을 내렸는데, 판결에서 문제된 행위는 1) Library상의 책 데이터를 LLM 학습에 이용한 행위와 2) LLM 학습에 이용하지 않은 데이터를 그대로 Library 형태로 보관한 행위입니다. 

 

나누어서 살펴보겠습니다. 

 

수천만권의 책을 LLM 학습에 이용한 행위

먼저, Anthropic이 자신이 만든 Library상의 도서 데이터를 LLM 학습에 이용한 행위에 대해, 법원은 놀랍게도 AI가 책 데이터를 학습한 행위가 마치 사람이 어떤 책을 보고 학습한 다음 새로운 지식을 구성하는데 사용한 행위와 같다고 보았습니다.

 

구체적으로 말씀드리자면, Fair Use를 인정받는데 가장 중요한 개념은 "Transformative Use(변형적 이용)"인데, 이는 원저작물에 새로운 표현을 추가하거나 새로운 의미 또는 메시지를 갖도록 변형하여 사용한 경우 공정이용행위로서 저작권 침해가 되지 않는다는 개념입니다.

 

법원은 사람이 책을 읽고 그것을 토대로 글을 쓰듯, 앤트로픽의 AI도 기존 작품을 모방하거나 대체하려는 것이 아니라 새로운 것을 창조하기 위한 학습이므로, Transformative Use로서 Fair Use에 해당하여 저작권 침해가 아니라고 판단하였습니다. 

 

"Everyone reads texts, too, then writes new texts.

They may need to pay for getting their hands on a text in the first instance.

But to make anyone pay specifically for the use of a book each time they read it,

each time they recall it from memory, each time they later draw upon it when writing new things in new ways would be unthinkable."

 

"모든 사람은 텍스트를 읽고, 새로운 글을 쓴다. 

물론 처음 텍스트를 손에 넣을 때는 비용을 지불해야 할 수 있지만 책을 읽을 때마다, 기억에서 떠올릴 때마다, 새 글을 쓸 때 과거에 읽은 내용을 참고할 때마다 그때그때마다 따로 돈을 내야 한다면, 이는 상상하기 어려운 일일 것이다."

다만, 판결문을 보면 이는 데이터를 Input한 행위에 대해서만 판단한 것이고 클로드AI가 그 데이터를 학습한 후 산출한 Output에 대해서 판단한 것이 아니라고 강조합니다.

 

즉, User들이 클로드 AI를 사용하면서 보게 된 Output이 저작물의 표현과 유사한 형태여서 저작권을 침해했다면, 사건의 결과가 달라질 수 있다고 암시하고 있습니다. 

 

수천만권의 책을 Library로 만들어서 계속 보관한 행위

두 번째로 수천만권의 책을 Library로 만들어서 계속해서 보관한 행위에 대해서 법원은, Anthropic이 그 Library의 Source가 된 책들을 합법적으로 구매했는가를 기준으로 판단하였습니다. 

 

즉, Library에 저장된 책들을 다시 1) 합법적으로 구매한 종이책을 디지털로 변형한 복사본과 2) 해적판을 다운로드하여 보관한 복사본으로 구분하여,

 

합법적으로 구매한 종이책의 경우에는 종이에서 디지털로 보관의 형태만 바뀐 것이므로 Fair Use에 해당하지만, 해적판의 경우에는 애초에 위법한 취득이므로 Fair Use에 해당할 수 없다고 판단하였습니다. 

 

얼핏 보면 Anthropic의 승리처럼 보일 수 있으나, 해적판 사용에 대한 손해배상만 하더라도 천문학적인 액수가 될 가능성이 높기 때문에 Anthropic에게 반드시 승리라고 하기는 어렵다는 것이 현지 전문가들의 의견입니다.

 

Anthropic 판결이 시사하는 것

일단 위법하게 취득한 해적판 저작물에 대해서는 그 저작물을 이용하여 Library를 만든 것이 저작권법 위반에서 벗어날 수 없음을 확실히 하였습니다. 

 

많은 언론들이 이 포인트만 강조하지만, 사실 이 판결에서 더 중요한 부분은, AI가 인간처럼 책을 읽고 ‘학습’한다는 개념을 저작권법의 관점에서 받아들였다는 점입니다. 이 점 때문에 향후 AI 기업들을 상대로 한 소송의 향방을 좌우할 수 있는 선례가 될 것으로 예상됩니다.

 

그러나 앞서 말씀드렸듯 법원은 학습된 AI가 산출한 산출물 자체에 대해서는 판단하지 않았으므로, 앞으로 AI가 산출한 데이터의 원본 저작권 침해 여부는 다른 판결에서 판단될 것으로 예상되며, 이 부분이 오히려 저작권법 관점에서는 더 중요한 부분이기도 합니다. 

 

AI 기업들이 꼭 알아두어야 할 Fair Use

Fair Use(공정이용)은 저작권법에서 매우 중요한 저작권 침해 예외사항에 해당하므로 AI 기업들에게 중요한 개념입니다. 

 

미국 저작권법상 Fair Use는 다음과 같은 4가지 판단 요소로 판단하며 Fair Use로 인정될 경우 저작권법 위반에서 벗어날 수 있습니다(Section 107 of the Copyright Act). 

  • 이용의 목적 및 성격 (상업적/비영리 여부 포함)
  • 저작물의 성격 (사실 기반 vs 창작물 등)
  • 사용된 양과 실질적 중요성
  • 저작물의 시장에 미치는 영향

중요한 점은 Fair Use는 각 사안마다 적용의 양태가 매우 다를 수 있기 때문에, 이번 판결에서 Fair Use가 인정되었다고 하더라도 반드시 다른 AI회사에도 Fair Use가 적용되는 것은 아니라는 점입니다. 

 

개인적으로 저는 이번 판결이 법리적으로만 따졌을 때에는 매우 다른 판단을 할 수 있기 때문에 항소심에서 뒤집힐 가능성도 있다고 봅니다.

 

다만, 가히 AI 전쟁이라 할 수 있는 이 시대에 법원이 AI의 개발 자체를 저해할 수 있는 판결을 내리기는 쉽지 않을 거라는 생각도 있어서 향후 상황을 지켜보려 합니다.

 

AI 기업들을 위한 법적 제언

(1) 데이터 수집의 적법성

이번 판결에서는 학습 데이터가 합법적으로 확보되었는지 여부가 핵심적인 판단 기준이 되었습니다. 따라서 ‘공정 이용’이 인정되기 위해서는 라이선스 또는 정당한 구매를 하는 것이 안전하다는 점을 말씀드리고 싶습니다.

 

다만, 이번 판결은 도서에 대한 부분에 국한되어 있기 때문에, 인터넷에 공개된 신문이나 블로그 등의 자료에 대해서는 다른 논리가 적용될 수 있고, 이때는 Terms of Use와 Fair Use가 함께 문제될 것입니다. 

 

(2) 산출물의 저작권 침해는 별개다 

이번 판결에서는 Input된 데이터의 Fair Use 여부만이 문제되었을 뿐, AI가 산출한 데이터에 대한 문제는 판단되지 않았습니다. 사실 저작권법은 "표현"을 보호하는 법이기 때문에, 원칙적으로 더 문제될 지점은 산출물에 대한 부분입니다. 

 

이에 대해서는 다른 사건에서 분쟁이 있기 때문에 다른 컨텐츠에서 다루되, 핵심적인 부분은 "표현에 있어서의 원본과의 유사성"이며 이 부분에 대한 AI 기업들의 준비가 필요하다는 점을 말씀드립니다.

 

(3) 계약과 합의의 중요성
AI와 저작권 문제가 불거지면서, OpenAI와 NewsCorp 등의 사례처럼 콘텐츠 보유자와의 라이선스 계약이 체결되거나 분쟁에 대한 합의가 경우가 많아지고 있습니다. 

 

Terms of Use도 같은 맥락에서 중요한 의미를 가지므로, AI 기업들은 Terms of Use를 반드시 신경쓰실 필요가 있고, 끝그림으로서 분쟁에 대한 합의의 필요성에 대해 인식하고 이를 미리 준비할 필요가 있습니다. 

 

감사합니다. 

장건 변호사 올림

 

상담신청: https://www.bnl.legal/contacts

기타문의: official@bnl.legal

관련글: https://kunchang.tistory.com/21

 

AI는 인간이 될 수 있을까

AI도 인간이 될 수 있을까요?  AI가 생물학적으로 인간이 되는 것은 당연히 불가능합니다.  하지만 역사적으로 생물학적인 인간이 아니지만, 법적으로 ‘인간’으로 인정된 주체가 있습니다.  

kunchang.tistory.com