AI 부상으로 콘텐츠를 만드는 출판사는 AI와 공존하거나 대결하는 선택을 강요받고 있다. 영국 출판 업계 미디어 보도에 따르면 미국 대형 출판사 펭귄 랜덤하우스(Penguin Random House)가 향후 출판되는 도서를 AI 학습에 사용하는 걸 명시적으로 금지하는 조치를 취할 것이라고 한다.
전해진 바에 따르면 펭귄 랜덤하우스는 전 세계에서 출판되는 신간과 재판본 저작권 표기 페이지를 개정해 대규모 언어 모델(LLM)을 포함한 AI 학습에의 사용을 금지한다는 문구를 삽입한다는 것.
새로운 저작권 표기 페이지에는 본서 어떤 부분도 AI 기술 또는 AI 시스템 학습 목적으로 어떤 방식으로도 사용 또는 복제할 수 없다고 쓰여 있다.
보도에 따르면 저작권 페이지에서 AI를 언급한 대형 출판사는 펭귄 랜덤하우스가 처음이라고 한다. 또 EU 디지털 단일 시장에서의 저작권에 관한 지침, 일명 CDSM 지침에 근거해 이 작품을 텍스트 및 데이터 마이닝 예외에서 명시적으로 유보한다는 표기도 추가된다.
기존 EU 규정에서는 저작권자 허가 없이 저작물을 사용할 수 있는 예외적 용도로 교육이나 보도 등이 규정되어 있었지만 2019년 채택된 CDSM 지침으로 그런 용도에 텍스트 및 데이터 마이닝(TDM)이 추가됐다. 이로 인해 학술 연구 등 목적으로 저작물을 자유롭게 TDM에 사용할 수 있게 되는 동시에 저작권자는 특정 저작물을 예외에서 명시적으로 유보한다고 선언함으로써 해당 작품을 예외 규정에서 빼고 무허가로 TDM에 사용하는 걸 금지할 수 있게 됐다.
하지만 이번 변경 실효성에 대해서는 의문도 나오고 있다. 보도에선 웹사이트가 robots.txt 파일로 콘텐츠를 AI 학습에 사용하지 말 걸 요청해도 종종 무시되는 걸 예로 들면서 이번 개정은 펭귄 랜덤하우스판 robots.txt와 같은 것으로 경고는 될 수 있겠지만 실제 저작권법과는 거의 관계가 없다며 저작권 페이지가 책 서두에 삽입되어 있는지 여부와 관계없이 저작권은 보호되고 권리자가 인정하는지 여부와 관계없이 공정 사용 등 명목으로 임의로 사용될 가능성이 있기 때문이라고 말했다.
출판사가 도서의 AI 사용을 명확히 거부하는 자세를 보이는 건 AI가 이미 대량 해적판 책으로 학습되고 있다는 실태가 보도되는 가운데 옥스퍼드 대학 출판부 등 저명한 출판사가 AI 기업에 라이선스를 제공하는 방침을 보이는 등 적어도 AI에 의한 사용에서 정당한 대가를 얻는 방법을 모색하려는 움직임에 역행하는 것이라고 지적되고 있다.
한편 여러 작가와 대형 미디어가 콘텐츠를 AI 학습에 무단 사용하는 건 저작권 침해라며 AI 기업을 제소하고 있어 AI 대응을 둘러싸고 업계는 크게 양분되어 있다.
이번 결정에 앞서 펭귄 랜덤하우스는 지난 8월 인간 창의성을 옹호할 것, 저자와 아티스트에게 속하는 지적 재산을 적극적으로 보호할 것, 책임감 있게 생성형 AI 도구를 사용할 걸 선언하는 3가지 원칙을 발표했다.
폭스윌리엄스 법률사무소 저작권 변호사는 AI가 저작물을 복제하거나 저작권 침해에 해당하는 출력을 생성할 가능성은 극히 낮지만 LLM에 의한 학습은 그 자체가 침해 행위이므로 출판사는 자사와 저자 이익을 위해 그런 행위를 통제할 수 있어야 한다며 생성형 AI 가속화는 출판 업계에 있어 생존과 관련된 문제가 되어가고 있지만 더 현실적인 우려는 콘텐츠가 동의 없이 학습에 사용되면 출판사와 저자 모두 수익을 상실하게 된다는 것일 것이라고 논평했다. 관련 내용은 이곳에서 확인할 수 있다.