테크레시피

美 작가 3인, 저작권 침해했다며 오픈AI‧메타에 소송

미국인 작가 3명이 지난 7월 7일 오픈AI의 챗GPT와 메타의 LLaMA에 저작권을 침해당했다며 양사를 제소했다. 원고는 저작권으로 보호된 책이 양사 AI 모델에 대한 학습 자료로 사용될 것에 동의하지 않는다고 밝혔다.

이번에 오픈AI와 메타에 소송을 건 측은 코미디언이자 작가이기도 한 사라 실버맨과 작가 크리스포터 골든, 리처드 카들리다. 원고는 챗GPT와 LLaMA가 인터넷에 불법적으로 유통되는 작품을 데이터세트로 학습시킨 것이라고 주장했다.

원고는 챗GPT와 LLaMA에 저작권을 침해당한 증거로 이들 문장 생성 AI가 자신의 책을 요약한 걸 증거 자료로 제출하고 있다. 오픈AI에 대한 소송에서 원고 측은 작품이 토렌트 트래커 사이트(Bibliotik)나 불법 복제된 서적 검색 엔진인 라이브러리 제네시스, 해적판 전자책 데이터베이스인 Z-라이브러리 등 어둠 속 라이브러리에서 입수한 것으로 이들 책은 토렌트를 통해 대량 입수할 수 있다고 지적하고 있다.

또 메타에 대한 또 다른 소송에선 LLaMA 학습에 사용된 데이터세트로부터 저작권으로 보호된 도서에 액세스할 수 있었다고 한다. 메타는 LLaMA에 대한 자세한 내용을 논문에 공개하고 있으며 출처로 학습용 데이터세트로 명시하고 있지만 그 중 하나에 더파일(ThePile)이 있다. 더파일을 만든 AI 연구자 그룹(EleutherAI)은 논문에서 토렌트 개인 트래커 콘텐츠 사본으로 만들어진 것으로 설명하고 있으며 원고 측은 어둠 속 라이브러리 사용은 분명한 불법이라고 밝히고 있다.

이들 작가는 동의 없이 자신의 서적이 학습 교재에 사용됐다며 오픈AI와 메타에 저작권 침해, 과실, 부당 이득 등 6가지 항목으로 소송을 걸고 손해 배상과 이익 반환을 요구했다. 작가가 문장 생성 AI 개발 기업에 소송을 한 게 이번이 처음은 아니다. 지난 6월 28일 작가 모나 아와드와 폴 톤브레이가 동의 없이 작품을 챗GPT 학습에 사용했다며 저작권 위반으로 오픈AI에 소송을 걸었다. 보도에 따르면 이는 챗GPT가 저작권을 위반했다며 오픈AI가 소송 당한 첫 사례라고 한다.

한 저작권법 연구자는 원고는 오픈AI가 자신의 작품을 복사해 경제적 존재가 발생했다는 걸 증명할 필요가 있다며 작품을 데이터베이스에 복사하는 건 침해 행위에 해당하는 것으로 보이지만 이 행위만으로 저작권자의 경제적 이익에 큰 손해가 발생할 가능성은 높지 않다며 이 소송이 실패로 끝날 수 있다고 지적했다. 한편 문장 생성 AI 외에 이미지 생성 AI인 스테이블 디퓨전과 미드저니도 지난 1월 집단 소송을 당했다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사