테크레시피

런웨이 영상 생성 AI, 사진 유튜버 영상 수집했나

AI 기업 런웨이(Runway)가 지난 6월 발표한 동영상 생성 AI 모델 젠-3 알파(Gen-3 Alpha)가 사진 관련 유튜버 동영상을 스크래핑해 훈련됐을 가능성이 지적됐다.

보도에선 런웨이 직원이 유튜브와 해적판 영상 사이트 등에서 영상 데이터를 수집해 최신 동영상 생성 AI 모델인 젠-3 알파 훈련에 사용했음을 보여주는 내부 문서를 입수했다고 밝혔다. 이 내부 문서에 따르면 AI 모델을 구축하기 위해 양질의 동영상을 찾는 게 런웨이에서는 전사적인 노력으로 진행됐다고 한다.

이 내부 문서에는 추천 채널과 추천 키워드, 해시태그 등이 정리되어 있었으며 Kai W(구독자 수 95만 명 이상), Peter McKinnon(구독자 수 594만 명 이상), Michael Shainblum(구독자 수 12만 명 이상) 등 인기 사진 유튜버 채널이 나열되어 있다.

또 리스트에 있는 일부 유튜버명을 프롬프트로 사용해 젠-3 알파로 동영상을 생성했을 때 특정 크리에이터 동영상과 매우 유사한 동영상이 생성되는 걸 발견했다고 한다 예를 들어 아이슬란드에서의 사진 촬영에 관한 동영상을 유튜브에 게시하는 벤자민 하드만(Benjamin Hardman) 이름을 사용하면 그의 게시 동영상과 유사한 게 출력된다고 한다.

그 밖에도 소니 α7 IV나 FX3와 같은 특정 카메라로 촬영된 동영상도 중점적으로 스크래핑됐으며 이는 소니 카메라로 촬영한 것 같은 동영상을 생성해줘 같은 프롬프트에 대응하기 위한 것으로 예상된다.

다만 보도에서 입수한 건 런웨이가 사내에서 작성한 스프레드시트일 뿐이며 이런 동영상이 실제로 훈련에 사용됐다는 증거는 없다. 런웨이는 프롬프트에서 훈련에 사용했다고 여겨지는 유튜버명을 차단하기 시작했다고 한다.

한편 구글은 유튜브 동영상을 AI 훈련에 사용하는 게 이용약관에 위반되는 행위라고 명시적으로 밝히고 있다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독