미국 일간지 뉴욕타임즈가 지난해 12월 저작권 침해로 오픈AI와 마이크로소프트를 제소한 것에 대해 오픈AI가 이 주장에는 근거가 없다며 반박글을 발표했다.
오픈AI는 1월 8일 공개한 글에서 자사와 뉴욕타임즈가 2023년 12월 19일까지 기사 이용에 대한 협상을 계속 해왔다는 걸 밝히며 뉴욕타임즈가 오픈AI를 제소했다는 걸 12월 27일 지면을 통해 알게 됐다는 건 자사에게 놀라움과 실망이었다고 밝혔다.
뉴욕타임즈 측 주장은 챗GPT가 기사를 도용했다는 것이다. 이에 대해 오픈AI는 뉴욕타임즈가 의도적으로 학습 데이터를 반복해 기사를 도용하는 것처럼 출력시켰다고 지적했다. 오픈AI에 따르면 챗GPT 도용 증거로 제시된 뉴욕타임즈 기사는 복수 사이트에 전재되어 있는 낡은 기사라고 한다. 오픈AI는 챗GPT가 학습 데이터로 사용되더라도 오픈AI는 브라우즈(Browse)라는 챗GPT 기능을 제거했기 때문에 일반적인 절차로 기사 복제가 이뤄지지 않게 되어 있다고 주장하고 있다.
이를 통해 오픈AI는 뉴욕타임즈 주장에 대해 자사 모델이 앵무새처럼 답을 하도록 기사 긴 발췌문을 포함하게 프롬프트를 의도적으로 조작한 것 같다며 그렇다고 해도 자사 모델은 보통 뉴욕타임즈가 지적한 것처럼 행동하지 않는다며 따라서 이는 뉴욕타임즈 측이 앵무새처럼 반환하도록 지시했거나 많은 시도 중 체리피킹해 예를 제시한 것이라고 밝혔다.
뉴욕타임즈에 의한 저작권 침해 호소를 부인하는 한편 오픈AI는 저작권으로 보호된 콘텐츠 사용은 AI 발전에 필수적이라는 필요성을 강조하고 있다. 오픈AI는 영국 상원 통신 디지털위원회에 제출한 자료 중 오늘날 저작권은 블로그 게시물, 사진, 포럼 게시물, 소프트웨어 코드 일부, 정부 문서 등 모든 종류 표현을 다루기 때문에 저작권으로 보호되는 자료를 사용하지 않고도 주요 AI 모델을 학습시키는 건 불가능하다고 밝혔다.
오픈AI는 또 EU와 싱가포르, 이스라엘, 일본 등 국가에 저작권 보호 콘텐츠를 AI 모델 학스벵 사용하는 걸 인정하는 법률이 있다는 점을 지적하며 이런 이용법은 페어 유스로 허용되고 있다는 견해를 보였다. 이런 관점에서 오픈AI는 뉴욕타임즈 소송에 근거가 없다고 본다며 이를 실현해 질 높은 저널리즘을 창출하는 능력을 돕기 위해 보도기관과 지속적인 협력을 실현할 것으로 기대하고 있다고 마무리했다. 관련 내용은 이곳에서 확인할 수 있다.