테크레시피

오픈AI 저작권 소송서 챗GPT 학습 데이터 일부에 공개

사라 실버만(Sarah Silverman)을 포함한 작가 3명이 오픈AI를 고소한 재판에서 원고가 엄격한 보안 하에 AI 학습에 사용된 자료를 검토할 수 있게 됐다는 사실이 밝혀졌다.

2023년 코미디언이자 작가인 사라 실버만을 포함한 유명 작가는 저작권 침해 혐의로 오픈AI와 메타를 상대로 소송을 제기했다. 하지만 여러 소송 중 오픈AI를 상대로 한 소송 초기 단계에서는 실버만 등의 주장이 대부분 법원에서 기각되는 등 원고에게 불리한 전개가 이어졌다.

실버만 등이 제기한 소송 주요 내용은 직접적 저작권 침해, 간접적 저작권 침해, 디지털 밀레니엄 저작권법(DMCA) 위반, 캘리포니아 주의 불공정 경쟁법(UCL) 위반, 과실, 부당 이득 6가지로 나뉜다. 이 중 UCL 위반과 직접적 저작권 침해를 뺀 나머지 4건은 2024년 2월 기각됐다.

이에 작가 측은 저작권으로 보호된 작품을 허가 없이 AI 학습에 사용한 건 캘리포니아 주법에서 금지된 불공정한 상행위에 해당한다”고 주장했다. 하지만 캘리포니아 지방 법원 판사는 지난 7월 판결에서 침해가 발생한 것으로 주장되는 건 저작권으로 보호된 작품이며 이와 같은 소송은 주법이 아닌 연방 저작권법에 의해 처리되어야 한다고 판단해 UCL 위반 혐의도 기각했다. 이에 따라 오픈AI를 상대로 한 이번 소송에서 실버만 측이 남긴 주장은 직접적 저작권 침해뿐이다.

9월 24일 법원에 제출된 서류에 따르면 실버만 측이 데이터 검토 절차에 합의한 게 밝혀졌다. 그동안 오픈AI는 챗GPT 학습 데이터를 공개하지 않았다.

계약에 따르면 학습 데이터 세트 검토는 오픈AI 샌프란시스코 사무실에 있는 인터넷 등 네트워크에 접속할 수 없는 보안이 강화된 컴퓨터에서 진행될 예정. 또 데이터를 검토하는 사람은 먼저 비밀 유지 계약서에 서명하고 신분증을 제시한 뒤 방문자 명부에 기입해야 한다.

검토 중에는 모든 기술 장치 사용이 엄격히 제한되며 PC, 휴대전화, 카메라 등 기록 장비 반입이 금지된다. 오픈AI는 메모를 작성하기 위해 제한적으로 컴퓨터 사용을 허용하지만 메모는 그날이 끝난 뒤 원고 측 변호사가 회사가 지정한 대표자 입회 하에 다른 장치로 복사된다. 학습 데이터 자체 복사는 어떤 부분도 허용되지 않는다.

신청서에는 검사 당사자 변호사 및 전문가는 제공된 메모 작성용 컴퓨터에서 손으로 작성한 메모나 전자 메모를 작성할 수 있지만 학습 데이터 자체를 메모에 복사하는 건 금지된다고 명시되어 있다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독