테크레시피

텍스트만으로 영상 생성 가능한 제너레이티브 AI

이미지 생성 AI 스테이블 디퓨전 개발에 종사한 AI 스타트업인 런웨이리서치(Runway Research)가 텍스트에서 영상 클립을 생성하는 젠-2(Gen-2)를 3월 20일 공개했다.

젠-2 전신은 런웨이리서치가 지난 2월 발표한 기존 동영상에서 새로운 영상을 합성할 수 있는 제너레이티브 AI인 젠-1이다. 이번에 발표한 젠-2에선 기능을 더 발전시켜 텍스트로부터 영상을 생성할 수 있게 됐다. 예를 들어 사막 풍경 드론 영상 같은 텍스트를 입력하면 황량한 풍경 영상이 출력되는 식이다.

비슷한 AI로는 메타가 선보인 메이크어비디오(Make A Video)나 구글 이메진비디오(Imagen Video) 등이 선행하고 있는 상태지만 런웨이리서치는 불과 45명 팀으로 개발하고 있다는 점에서 대기업이 선보인 제너레이티브 AI와는 다르다고 할 수 있다.

데모 클립은 3초 정도로 길이나 화질은 짧고 거칠며 프레임레이트도 낮다. 또 누구라도 사용할 수 있는 상태가 아니며 지금은 디스코드를 거쳐 등록해 대기 목록에 추가를 해야 한다. 런웨이리서치 측에 따르면 젠-2는 앞으로 몇 주간 폭넓은 접근이 이뤄지게 될 것이라고 한다.

또 런웨이리서치 측은 젠-2로 생성된 영상은 무음이지만 미래에는 음성도 생성할 수 있는 시스템을 목표로 음성 생성 연구를 실시하고 있다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독