깃허브가 제공하는 프로그래밍 지원 AI인 깃허브 코파일럿(GitHub Copilot)이 깃허브 상 코드를 불법적으로 복사하고 있다는 이유로 개발자로부터 소송이 제기됐다. 하지만 담당 판사는 22건 청구 중 20건을 기각했다.
깃허브 코파일럿은 2021년 깃허브가 발표한 소스 코드 후속 부분을 AI가 자동으로 완성해주는 기능. 깃허브 코파일럿은 깃허브 상 코드로 학습됐기 때문에 출시 직후부터 일부 개발자로부터 자신이 작성한 코드를 출력하고 있다는 의견이 제기됐고 저작권을 침해할 가능성이 지적되기 시작했다.
2022년 11월에는 깃허브 코파일럿 개발에 참여한 깃허브, 마이크로소프트, 오픈AI 3사가 오픈소스 프로그래머 작업으로부터 이익을 얻고 있다는 이유로 집단 소송이 제기됐다. 원고 측은 깃허브 코파일럿이 깃허브에 호스팅된 오픈 소스 소프트웨어 코드로 훈련됐으며 디지털 밀레니엄 저작권법(DMCA)을 침해하고 있다고 주장했다.
이 소송은 처음에 22건 청구로 시작됐지만 마이크로소프트, 깃허브, 오픈AI 3사가 소송 기각을 요청했고 담당 판사는 점진적으로 청구를 기각해 왔다. 지난 7월 5일에는 새로 3건 청구가 기각되어 최종적으로 22건 청구 중 2건만이 남게 됐다.
이번에 기각된 청구는 상당히 중요한 것으로 하나는 DMCA 제1202조(b)에 근거한 침해에 관한 것이다. 제1202조(b)는 기본적으로 라이선스에서 규정된 대로 코드를 작성한 사람이나 사용 조건 등 중요한 저작권 관리 정보를 허가 없이 삭제해서는 안 된다는 것이다. 이번 소송에서 원고 측은 깃허브 코파일럿이 사용자가 생성한 코드 스니펫을 제공할 때 라이선스 정보를 삭제하고 있으며 이는 DMCA 제1202조(b)를 위반하고 있다고 주장했다.
하지만 판사는 깃허브 코파일럿이 생성하는 코드가 원본 코드와 충분히 동일하지 않기 때문에 DMCA 제1202조(b)가 적용되지 않는다고 판단해 청구를 기각했다. 실제로 깃허브는 깃허브 코파일럿이 생성하는 코드가 원본의 완전한 복사본이라고 비난받는 걸 방지하기 위해 깃허브 코파일럿을 조정했다고 보도됐다.
원고 측은 반복적으로 깃허브 코파일럿이 오픈 소스 코드를 복사해서 출력하고 있다고 주장했으며 이 주장은 DMCA 위반을 주장하는 데 중요한 근거가 됐다. 하지만 이번에 판사가 코드를 복사해서 출력하고 있다는 사례가 입증되지 않았다고 판결함에 따라 원고 측은 DMCA 제1202조(b)에 근거한 청구를 할 수 없게 됐다.
구체적으로 판사는 깃허브 코파일럿은 무해한 상황에서는 기억한 코드 복사본을 거의 출력하지 않으며 훈련 데이터와 매우 유사한 긴 코드 발췌가 모델에 제시된 경우에만 코드 복사본이 출력된다는 연구 논문을 인용하며 다시 말해 깃허브 코파일럿이 이론적으로는 사용자 지시에 따라 다른 사람 코드와 일치하는 걸 생성할 가능성이 있다는 연구 결과에 원고가 의존하고 있는 건 설득력이 부족하다고 주장했다.
한편 이번에 판사가 기각한 나머지 2건 청구는 부당 이득과 징벌적 손해배상에 관한 것으로 이들은 수정해 재제출될 가능성이 있다고 한다. 다만 재제출까지는 유효한 청구가 2건만 남게 된다. 이 남은 2건 청구는 오픈 소스 라이선스 위반에 관한 청구와 계약 위반에 관한 청구다.
깃허브는 이번 기각에 대해 AI는 세계가 소프트웨어를 구축하는 방식을 변화시키고 생산성 향상, 가장 중요하게는 개발자 만족도 향상으로 이어질 것이라고 강하게 믿는다며 깃허브 코파일럿이 적용법을 준수하고 있다고 확신하며 처음부터 깃허브 코파일럿으로 책임감 있게 혁신하는 데 힘써왔다고 강조했다. 또 앞으로도 AI를 활용한 개발자 경험에 투자하고 추진할 것이라고 덧붙였다. 관련 내용은 이곳에서 확인할 수 있다.