오픈AI는 AI 학습에 뉴스 미디어 콘텐츠를 이용하는 게 문제시되고 있으며 일부 미디어에선 소송을 제기하고 있다. 이에 대응하기 위해 오픈AI가 뉴스 미디어에 대해 100만 달러에서 500만 달러 라이선스 요금을 지불하는 방향으로 협의를 진행하고 있다는 보도가 나왔다.
2023년은 오픈AI 챗GPT와 구글 바드, 마이크로소프트 코파일럿 등 생성형 AI가 약진한 한 해였다. 이런 생성형 AI 기반이 되는 건 대규모 언어 모델 LLM으로 LLM 학습에는 인터넷상에 존재하는 다양한 데이터가 이용되는 것으로 알려져 있다. 하지만 AI 학습에 이용되는 데이터세트에 유명 작가 서적 등이 포함된 게 문제가 되어 규제 당국에 엄격한 대처를 요구하는 목소리도 나오고 있다.
바드를 개발하고 있는 구글도 당초에는 AI 도구 개발을 촉진하기 위해 온라인으로 공개된 모든 걸 AI를 위해 수집한다고 발표했지만 콘텐츠 크리에이터 측 반발로 생성형 AI 학습에 자사 웹사이트가 사용되지 않게 하는 옵션을 발표했다.
언론 등 미디어는 콘텐츠를 AI 학습에 이용하는 것에 반발하고 있으며 미국에서 발행 부수 3위인 일간지 뉴욕타임즈는 생성형 AI 학습에 자사 콘텐츠를 사용하지 않게 크롤러 액세스를 차단하는 것 외에도 오픈AI와 마이크로소프트를 저작권 침해로 제소했다.
뉴욕타임즈는 오픈AI 챗GPT나 마이크로소프트 코파일럿 등 생성형 AI 기반이 되는 LLM인 GPT-4가 뉴욕타임즈 콘텐츠를 학습에 이용해 자사 표현 스타일을 모방한 출력을 해 자사와 직접 경쟁하는 콘텐츠를 만들어내고 있다고 주장하고 있다.
실제로 뉴욕타임즈가 법원에 증거로 제출한 자료 중 하나에선 챗GPT 기반인 GPT-4가 출력한 2019년 퓰리처상 수상자 관련 텍스트가 뉴욕타임즈 기사를 거의 그대로 모방한 내용이라고 지적하고 있다. 이런 반발에 대해 오픈AI는 미국 내 대형 미디어와 콘텐츠를 라이선스 받기 위한 가격과 조건을 협의하고 있다고 보도되고 있다. 이 보도에 따르면 오픈AI는 미국 주요 신문사이자 USA투데이 발행사인 가넷(Ganett), 월스트리트저널 발행사인 뉴스코프(News Corp), 데일리비스트 운영사인 IAC 등과 라이선스에 대해 협의하고 있다고 한다. 오픈AI 협의에는 오픈AI 최대 투자자이기도 한 마이크로소프트 역시 참가하고 있다고 한다.
비용 지불을 받아 콘텐츠 이용을 허가하고 있는 기업도 있다. 폴리티코와 비즈니스 인사이더 같은 미디어를 보유한 독일 미디어 기업인 악셀슈프링거는 2023년 12월 오픈AI와 계약을 맺고 챗GPT가 폴리티코, 비즈니스 인사이더에서 직접 데이터를 검색할 수 있도록 허용했다. AP통신은 오픈AI가 뉴스 기사를 기반으로 AI 모델을 학습하도록 허용하는 계약을 체결했다.
새롭게 오픈AI가 AI 학습에 뉴스 미디어 콘텐츠를 이용하기 위해 라이선스 비용으로 100만 달러에서 500만 달러 지불을 제시하고 있다는 게 밝혀졌다. 이번 보도는 오픈AI가 AI 학습에 이용하는 데이터에 어느 정도 자금을 투입할 예정인지를 보여주는 첫 지표 중 하나라는 지적이다.
기술 기업 콘텐츠 사용이 문제가 된 유사 사례로 2019년 페이스북에 도입된 뉴스탭이 있다. 메타는 이 뉴스 탭에서 뉴스 기사 라이선스 요금으로 연간 최대 300만 달러를 미디어에 지불했다고 보도됐다. 또 구글은 캐나다 뉴스 배급 사업자가 보도기관에 사용 요금을 지불하도록 결정한 온라인뉴스법에 따라 캐나다 보도기관에 연간 총액 1억 캐나다 달러를 지불하는 것에 동의했다. 이런 사례로부터 100만 달러에서 500만 달러라는 라이선스 비용은 기존 계약과 거의 동등한 수치라는 지적이다. 레딧 등에선 미디어 측에 지불되는 라이선스 요금이 너무 적다는 목소리도 나온다.
오픈AI 연간 매출은 16억 달러에 달하며 월 매출은 최대 1억 3,000만 달러다. 2022년 오픈AI 연간 매출은 불과 2,800만 달러였던 만큼 매출은 전년 대비 58% 증가했다. 더구나 오픈AI의 2024년 연간 매출은 50억 달러에 달할 전망이어서 오픈AI가 미디어에 지불할 예정인 라이선스 요금은 회사 입장에선 그다지 부담스럽지 않다고 예상할 수 있다.
그 밖에 애플도 뉴스 미디어 콘텐츠를 이용해 AI를 학습시키기 위해 여러 미디어와 5,000만 달러 이상 다년 계약에 대해 논의한 게 보도되고 있다. 관련 내용은 이곳에서 확인할 수 있다.