뉴욕타임즈는 2023년 12월 챗GPT가 자사 기사를 복사해 거의 그대로 출력했다며 오픈AI를 저작권 침해로 제소했다. 오픈AI는 뉴욕타임즈가 의도적으로 문제를 일으켜 챗GPT가 기사를 복사한 것처럼 보이게 했다고 반박했지만 이에 대해 뉴욕타임즈는 버그를 일으켜 챗GPT가 유료 기사를 도용한 증거라고 밝혔다.
챗GPT가 저작권으로 보호된 콘텐츠로 훈련되어 종종 일부를 출력하는 문제를 둘러싸고 많은 미디어나 작가가 오픈AI를 제소했으며 그 중 하나가 뉴욕타임즈다. AI가 저널리즘을 위협하고 있다고 지적한 뉴욕타임즈에 대해 오픈AI는 뉴욕타임즈가 챗GPT에 의한 표절 증거로 제출한 자료는 학습 데이터 역류나 환각 등 문제를 의도적으로 일으켜 얻은 것이라며 법원에 소송 각하를 요구했다.
뉴욕타임즈는 새롭게 재판에 제출한 문서를 통해 챗GPT에 자사 기사를 출력시킨 방법은 적절하다고 옹호하면서 챗GPT 사용자는 유료 기사 액세스 제한을 우회하기 위해 챗GPT가 전체 기사를 생성한다고 지적했다. 뉴욕타임즈는 챗GPT가 기사를 복사하고 있는지 확인하기 위해 기사 첫 단어 몇 개와 문장을 프롬프트로 사용해 GPT-4에서 학습 내용을 빼냈다고 재판 문서에 기재하고 있다.
또 오픈AI는 챗GPT 사용자는 유료 기사에서 텍스트를 생성하는 것 같은 사용법은 없다고 주장하고 있지만 뉴욕타임즈는 페이월을 우회하기 위한 챗GPT 사용법은 널리 보도되고 있다고 반박했다. 뉴욕타임즈에 따르면 이전 챗GPT에 의한 저작권 침해는 학습할 때 복사된 기사를 표시시키는 방법에 의해서만 이뤄지고 있었다고 한다. 하지만 2023년 5월 플러그인(Browse By Bing)이 챗GPT에 도입되면서 챗GPT는 기초 모델 학습 데이터세트에 포함되어 있던 것 이상 콘텐츠를 취득할 수 있게 됐고 사용자 검색어에 따라 기사 내용을 검색 결과에 표시하는 저작권 침해가 가능하게 됐다고 뉴욕타임즈는 주장하고 있다.
이 새로운 기능을 통해 챗GPT 사용자는 돈을 지불하지 않고 유료 기사를 읽을 수 있어 오픈AI는 지난해 7월 이 플러그인을 일시적으로 사용 중단했다. 오픈AI는 도움말 페이지에서 해당 플러그인 베타 버전에서 원치 않는 방식으로 콘텐츠를 표시할 수 있다는 걸 발견했다며 예를 들어 사용자가 URL을 표시하고 콘텐츠를 요청하면 실수로 발생한다며 문제가 해결될 때까지 플러그인 사용을 일시 중단한다고 설명했다. 챗GPT 사용자는 챗GPT를 사용해 페이월을 우회할 수 있는 것 같다고 지적하기도 했다.
아마조 오픈AI에게 가장 어려운 점은 오픈AI가 이 플러그인을 도입하기 직전인 2023년 4월 뉴욕타임즈가 오픈AI에 챗GPT가 저작권을 침해하고 있다고 통보하기 위해 연락을 취한 점이라는 지적이다. 음악 파일 공유 서비스인 냅스터(Napster) 관련 재판에선 컴퓨터 시스템 오퍼레이터가 시스템상에서 이용 가능한 저작권 침해물 존재를 알면서 이를 시스템에서 삭제하지 않으면 오퍼레이터는 직접 침해에 관여하고 있었으므로 직접적으로 침해에 가담한 것이라는 판례가 나온 바 있기 때문이다. 뉴욕타임즈는 이 판레를 인용해 자사는 챗GPT가 기사를 침해한 결과를 생성한다는 걸 오픈AI에 알렸다고 밝혔다.
오픈AI는 작가 3명이 낸 다른 저작권 침해 소송에서 거의 전면적으로 승리했으며 이를 발판으로 후속 재판을 유리하게 진행하려 하고 있다. 오픈AI는 뉴욕타임즈 소송에 대해 2024년 2월 각하된 작가 주장과 동일 내용을 포함하고 있다고 주장하고 있지만 뉴욕타임즈는 작가 소송과는 실질적으로 다르다는 견해를 보이고 있다.
오픈AI는 또 지난 1월 저작권으로 보호된 콘텐츠 없이 유용한 AI 모델을 구축하는 건 불가능하다며 기사 사용은 페어유스라고 주장했지만 보도에선 이 재판에서 뉴욕타임즈가 이기면 오픈AI는 챗GPT를 삭제하고 모든 걸 다시 시작해야 할 수도 있다고 지적하고 있다. 관련 내용은 이곳에서 확인할 수 있다.