테크레시피

스태빌리티AI, 텍스트→영상 생성 AI 공개했다

이미지 생성 AI인 스테이블 디퓨전을 개발하는 스태빌리티AI(Stability AI)가 텍스트나 이미지로부터 고해상도 영상을 생성할 수 있는 잠재 영상 확산 모델인 스테이블 비디오 디퓨전(Stable Video Diffusion)을 공개했다.

스테이블 비디오 디퓨전은 연구용 프리뷰로 공개되며 소스 코드는 깃허브 저장소에 게시된다. 또 로컬에서 모델을 실행하는데 필요한 가중치는 허깅페이스에서 확인할 수 있다. 스테이블 비디오 디퓨전은 14프레임과 25프레임을 생성할 수 있는 2가지 이미지 모델로 출시됐으며 3fps에서 30fps로 사용자 정의할 수 있는 프레임 속도로 영상을 생성할 수 있다.

스태빌리티AI 측은 스테이블 비디오 디퓨전을 자사가 보유한 다양한 모델에 추가하게 된 걸 기쁘게 생각한다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독

Most popular