이미지 생성 AI인 스테이블 디퓨전을 개발하는 스태빌리티AI(Stability AI)가 텍스트나 이미지로부터 고해상도 영상을 생성할 수 있는 잠재 영상 확산 모델인 스테이블 비디오 디퓨전(Stable Video Diffusion)을 공개했다.
스테이블 비디오 디퓨전은 연구용 프리뷰로 공개되며 소스 코드는 깃허브 저장소에 게시된다. 또 로컬에서 모델을 실행하는데 필요한 가중치는 허깅페이스에서 확인할 수 있다. 스테이블 비디오 디퓨전은 14프레임과 25프레임을 생성할 수 있는 2가지 이미지 모델로 출시됐으며 3fps에서 30fps로 사용자 정의할 수 있는 프레임 속도로 영상을 생성할 수 있다.
스태빌리티AI 측은 스테이블 비디오 디퓨전을 자사가 보유한 다양한 모델에 추가하게 된 걸 기쁘게 생각한다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.