테크레시피

텍스트로 동영상 생성해주는 AI

페나키(Phenaki)는 텍스트를 바탕으로 동영상을 생성해주는 AI다. 그 뿐 아니라 정지 화면에 프롬프트를 더해 숏폼 동영상화하는 것도 가능하다.

제작자에 따르면 페나키는 텍스트에서 압축된 이산적 동영상 토큰을 생성해 시간적인 인과 모델을 도입해 가변 길이 영상을 제작하고 있다고 한다. 덧붙여 논문 자체는 아직 공식 학회지에 게재된 건 아니다.

페나키에 대해선 텍스트를 바탕으로 정지 화상 몇 개를 생성한 다음 중간 화상을 생성하고 이를 연결하는 것처럼 보인다거나 숏폼 동영상에는 프롬프트에는 없는 요소가 포함되어 있어 다소 인간 손에 의한 미세 조정이 들어간 것 아니냐는 반응도 있다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사