테크레시피

“합법 취득한 책 통한 AI 학습, 작가 허가 필요 없다”

AI 챗봇 클로드(Claude)를 개발한 앤트로픽(Anthropic)이 미국 작가 3명으로부터 저작권 침해 혐의로 고소당한 사건에서 미국 캘리포니아 북부지방법원이 저자 허가 없이도 합법적으로 구매한 책을 AI 훈련에 사용하는 건 공정 이용(fair use)에 해당하며 저작권 침해가 아니라는 판결을 내렸다.

이번 소송은 언론인이자 작가인 안드레아 바츠, 찰스 그레이버, 커크 존슨이 2024년 8월 제기한 것으로 이들은 앤트로픽이 클로드 훈련에 해적판 사이트(LibGen, Books3) 데이터와 실제 책을 스캔한 자료를 사용한 건 명백한 저작권 침해라고 주장했다.

앤트로픽은 AI 훈련을 위해 해적판 사이트를 이용했고 책 수백만 권을 구입해 재단 후 스캔해 디지털화한 데이터를 사용했다는 걸 인정했다. 다만 이 모든 행위가 저작권법상 공정 이용에 해당한다고 항변했다.

이에 대해 판사는 3가지 주요 판단을 내렸다. 첫째 종이책을 스캔한 데이터로 AI를 훈련한 행위. 판사는 AI가 책의 내용을 복제하기 위해서가 아니라 새로운 문장을 만들어내기 위한 통계적 패턴을 학습하는 목적이라는 걸 강조했다. 클로드가 원본 책 복사본이나 표절물을 사용자에게 제공하는 건 아니라는 설명이다.

또 원고 측이 AI 훈련으로 자신의 작품과 경쟁할 수 있는 콘텐츠가 대량으로 만들어지고 시장이 침해된다고 주장한 것에 대해 판사는 아이에게 글쓰기를 가르친다고 해서 경쟁 작가가 늘어날 걸 우려하는 것과 같다고 반박했다. 저작권법은 경쟁으로부터 작가를 보호하는 게 아니라 창작물 발전을 촉진하는 데 목적이 있다는 판단이다.

둘째 구매한 책을 스캔해 디지털화한 행위. 앤트로픽이 정당하게 구매한 책을 재단하고 스캔해 디지털화한 행위도 공정 이용에 해당한다고 판결했다. 이는 앤트로픽 측 목적과 용도가 변형적(transformative)이기 때문이다.

판사는 앤트로픽은 이미 책 소유권을 보유하고 있었고 스캔 후에는 원본 책을 폐기했다며 디지털화 목적은 저장 공간 절약과 검색 효율성을 위한 것이며 외부 배포나 판매가 아닌 내부 연구 라이브러리에만 보관됐다는 점에서 공정 이용이 인정된다고 밝혔다.

또 디지털화는 단지 형식 변경일 뿐이며 저작권자의 배포권이나 2차 저작물 작성권을 침해하지 않는다고 판시했다.

셋째 해적판 사이트를 이용한 AI 훈련. 앤트로픽이 Books3, LibGen 등에서 책 수백만 권 데이터를 다운로드해 중앙 라이브러리를 구축한 사실은 인정됐다. 이와 관련해 앤트로픽 측은 당시 행동이 악의적이었다는 점은 인정하지만 공정 이용 판단에 영향을 주지는 않는다고 주장했다.

하지만 재판에서는 회사 내부에서도 해적판 데이터의 법적 리스크에 대한 우려가 있었다는 점이 드러났다. 판사는 해적판 데이터로 구성된 중앙 라이브러리는 유료 도서 대체물로 기능하며 이는 변형적이지 않기 때문에 공정 이용이 될 수 없다고 명확히 판결했다.

또 앤트로픽이 특정 책을 훈련에 사용하지 않겠다고 했음에도 불구하고 여전히 해당 데이터를 라이브러리에 보관한 점을 문제 삼았다. 판사는 AI 훈련 목적으로 사용될 예정이라고 해서 초기 불법 복제 행위가 정당화되는 건 아니라며 연구 목적으로 교과서를 훔쳐도 된다는 논리는 학술 출판 시장을 파괴하게 된다고 비판했다.

이번 판결은 합법적으로 수집된 책이라면 AI 훈련에 사용하는 건 공정 이용이며 작가 허락은 필요 없다는 법원의 판단을 명문화한 첫 사례로 앤트로픽을 비롯한 AI 기업에 유리한 전환점이 됐다.

앤트로픽은 법원이 대규모 언어 모델 훈련에 있어 저작물 이용을 변형적이라 인정한 데 대해 기쁘게 생각한다며 클로드는 기존 저작물을 복제하거나 대체하기 위해 훈련된 게 아니라 창의성을 가능케 하고 과학 진보를 촉진하는 저작권 목적에 부합하도록 완전히 새로운 걸 만들어내기 위해 훈련됐다고 밝혔다.

다만 해적판 데이터를 이용한 부분에 대해선 저작권 침해라는 판단이 명확히 내려졌기 때문에 판사는 해당 콘텐츠에 대해서는 별도 재판을 열어 손해배상액을 산정할 예정이라고 밝혔다. 단 이후 앤트로픽이 동일한 책을 정식으로 구입했을 경우에는 절도 책임이 면제되는 건 아니지만 법정 손해배상액 산정에는 영향을 줄 수 있다고 덧붙였다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독

Most popular