오픈AI, 저작권 소송 증거 데이터 실수로 삭제했다

이원영 기자

2024.11.25

오픈AI는 생성 AI 모델 학습에 콘텐츠를 사용했다고 주장하는 미국 대형 일간지 뉴욕타임스의 저작권 침해 관련 소송에 직면해 있다. 하지만 11월 20일 오픈AI가 법원에 제출한 문서에서 오픈AI는 이 재판과 관련된 증거 데이터를 실수로 모두 삭제해 버렸다고 밝혔다.

뉴욕타임스는 2023년 12월 챗GPT와 코파일럿 같은 생성 AI 기반이 되는 대규모 언어 모델이 뉴욕타임스 콘텐츠를 학습에 사용했으며 뉴욕타임스 표현 스타일을 모방한 출력이 가능해져 뉴욕타임스와 직접 경쟁하는 콘텐츠를 생산하게 됐다며 이로 인해 뉴욕타임스와 독자 관계가 손상되어 구독료, 라이선스 수수료, 광고 수익, 제휴 수입과 같은 수입원이 빼앗겼을 뿐 아니라 양질의 저널리즘 제공을 위협하고 있다며 오픈AI와 마이크로소프트를 저작권 침해로 고소했다.

뉴욕타임스와의 재판이 계속되는 가운데 오픈AI는 AI 학습 세트에 포함된 저작권으로 보호된 콘텐츠를 검색할 수 있는 가상 머신 2대를 뉴욕타임스 측에 제공했다. 오픈AI에 따르면 11월 1일 이후 뉴욕타임스 변호사는 전문가와 함께 150시간 이상을 들여 학습 데이터 검색을 실시했다고 한다.

하지만 오픈AI는 11월 20일 뉴욕 남부 지방 법원에 제출한 문서에서 자사 엔지니어가 11월 14일에 가상 머신 중 하나에 저장되어 있던 뉴욕타임스 검색 데이터를 모두 삭제해 버렸다고 보고했다.

오픈AI는 즉시 데이터 복구를 실시했지만 회수된 데이터에는 폴더 구조와 파일명에 심각한 문제가 발생했다. 오픈AI는 복구된 데이터로는 뉴욕타임스 기사가 오픈AI AI 모델 구축에 어떻게 사용됐는지 적절히 파악하기 어렵다고 말했다. 한편 오픈AI는 사고 발생 원인이나 삭제된 데이터 상세 내용에 대해서는 밝히지 않았다.

오픈AI는 이 데이터 삭제에 대해 오류에 의한 것이라고 설명했으며 뉴욕타임스도 삭제가 의도적이라고 단정할 증거는 없다고 말했다. 그럼에도 뉴욕타임스는 복구된 데이터는 거의 사용할 수 없는 상태이며 전문가와 변호사 1주일 분량 작업을 다시 해야 한다며 이번 데이터 삭제는 작업을 처음부터 다시 해야 하는 데 막대한 시간을 써야 하는 상황을 초래했다고 비판했다. 관련 내용은 이곳에서 확인할 수 있다.

한편 오픈AI는 챗봇이 통합된 웹브라우저 개발을 검토하고 있으며 검색 기능을 강화하는 계약에 대해서도 별도로 협의 또는 체결했다는 보도가 나왔다.

이에 따르면 이미 제품 프로토타입이 존재하며 오픈AI는 여러 웹사이트와 앱 개발자와 브라우저 및 검색 제품에 대해 논의했다고 한다. 다만 출시까지는 아직 시간이 더 필요한 상태라고 한다.

오픈AI는 검색 엔진과 관련해 지난 7월 AI와의 대화 형식으로 정보 검색이 가능한 서치GPT(SearchGPT)를 발표했으며 같은 해 11월에는 AI 검색 서비스 챗GPT 서치(ChatGPT search)를 공개했다.

검색 서비스를 공개하는 것 뿐 아니라 챗GPT를 통합한 브라우저도 새롭게 개발하려는 오픈AI 움직임은 브라우저 시장과 검색 시장에서 대부분 점유율을 차지하고 있는 구글과의 대립을 초래할 수 있다.

하지만 구글은 미국 법무부로부터 검색 및 검색 광고 시장에서 반경쟁적이고 배타적인 관행을 통한 독점 상태를 불법적으로 유지하고 있다고 지적받아 크롬 사업 매각을 요구받고 있다고 보도됐다.

보도에선 법무부가 구글의 온라인 검색 독점을 종식시키기 위해 크롬 매각을 요구함에 따라 구글은 브라우저 시장에서의 우위가 위태로워졌다며 구글이 오픈AI에 대항하는 힘이 약화됐을 가능성을 시사했다.

또 오픈AI는 자사 AI 기능을 삼성전자 기기에 탑재하는 것도 검토 중이라고 한다. 보도에선 관계자 말을 인용해 구글 주요 비즈니스 파트너인 구글 디바이스(Google Device)가 이 건으로 피해를 입었다고 보도했다.

구글 모회사인 알파벳 주가는 11월 21일 5% 하락했으며 시간외 거래에서 1% 추가 하락했다. 관련 내용은 이곳에서 확인할 수 있다.

이 글 공유하기:

추천기사