테크레시피

“어도비 파이어플라이, 학습 데이터 5%는 AI 이미지”

어도비 이미지 생성 AI인 파이어플라이(Firefly)는 어도비 스톡(Adobe Stock)이라는 사진‧동영상 라이브러리에서 학습되는 게 특징으로 어도비 측은 인터넷상 이미지를 스크랩해 학습한 다른 이미지 생성 AI와는 달리 상업적으로도 안전한 AI라고 주장해왔다. 하지만 실제로는 파이어플라이가 학습한 데이터세트에 미드저니 등에 의해 생성된 이미지가 포함되어 있다고 보도됐다.

이미지 생성 AI를 학습하려면 방대한 데이터가 필요하다. 미드저니, 달리, 스테이블 디퓨전 등 이미지 생성 AI는 인터넷에서 수집한 이미지로 구성된 데이터세트로 학습하고 있지만 창작자 저작권을 침해한다는 이유로 집단 소송이 제기되어 왔다.

한편 어도비 파이어플라이는 어도비가 권리를 보유한 이미지와 공유 영역 이미지 등 저작권 문제가 해결된 이미지만으로 학습된다고 한다. 어도비는 파이어플라이에 대한 상업적 안전성과 투명성에 자신감을 표명하며 파이어플라이로 생성된 이미지로 소송이 제기되면 법적 보상을 해주겠다고 선언하기도 했다.

어도비는 어도비 스톡이라는 자재 스톡을 운영 중이며 이곳에 등록된 이미지와 동영상이 파이어플라이 학습에 사용되고 있다. 한편 어도비 스톡은 2022년 말부터 AI 콘텐츠 수용을 시작했고 현재 전체 14%가 AI 생성 이미지로 태그되어 있다. 데이터세트에 이미지 생성 AI를 포함해 학습하는 것에 대해선 어도비 내부 의견도 엇갈렸던 것으로 알려졌다.

파이어플라이 베타 버전 공개 당시 어도비 스톡 커뮤니티 담당자는 정식 버전 출시에선 새로운 교육 데이터베이스를 사용해 AI 생성 콘텐츠를 제외할 계획이라고 밝혔었다. 하지만 보도에 따르면 파이어플라이 첫 상용 모델인 엔터프라이즈 버전 학습에 사용된 이미지 중 5%가 다른 이미지 생성 AI로 생성된 이미지였다고 한다.

미드저니로 생성한 작품을 어도비 스톡에 등록한 한 사용자는 어도비로부터 포상금이 지급되어 놀랐다고 말했다. 어도비는 파이어플라이 상용 모델 학습에 사용된 콘텐츠를 제공한 어도비 스톡 크리에이터에게 포상금을 지급했다. 하지만 한 AI 이미지 크리에이터는 어도비는 윤리적이어야 하며 더 많은 투명성을 높여야 한다며 이미지 생성 AI로 생성한 자신의 콘텐츠로 파이어플라이를 학습시킨 건 잘못됐다고 주장했다.

하버드대학교 법학자이자 저작권‧상표에 정통한 레베카 투시넷(Rebecca Tushnet) 교수는 이미지 생성 AI 콘텐츠로 학습했다고 해도 어도비 파이어플라이가 저작권이나 상표에 있어 안전성이 저하되는 건 아니며 소비자를 오해하게 하지 않는 한 학습 내용을 공개할 필요는 없다고 말했다. 하지만 그는 미드저니로 생성한 이미지로 학습했다는 점은 파이어플라이가 다른 이미지 생성 AI와는 다르다는 취지와 모순된다고 지적했다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독