오브젝트 이미지를 1장 입력하기만 하면 시점을 바꾼 고정밀도 이미지를 생성할 수 있는 AI 모델(Zero-1-to-3)을 미국 콜롬비아대학과 도요타리서치인스티튜트 연구팀이 개발했다.
이 모델은 대규모 확산 모델을 이용해 상대측 카메라 시점 제어를 학습한 AI 모델로 RGB 이미지 1장으로부터 카메라 시점을 바꾼 이미지를 출력할 수 있다. 또 이 모델을 이용해 생성한 다양한 관점에서 본 객체 이미지를 결합해 완전한 3D 모델을 재구성할 수 있다.
테스트 이미지를 이용해 다른 각도 이미지를 출력할 수 있는 데모도 공개되어 있다. 옵션을 이용해 입력 이미지를 선택할 수도 있다. 수직이나 수평 각도, 줌, 랜덤 시드값 등을 슬라이드바로 설정하면 설정 관점에서 본 이미지가 생성된다. 하나 뿐 아니라 다양한 관점에서 이미지를 생성할 수도 있다.
AI 관련 리포지토리 사이트인 허깅페이스에도 데모 페이지가 공개되어 있다. 이를 통해 자신이 좋아하는 이미지를 입력해 시점이 다른 이미지를 출력해볼 수도 있다. 관련 내용은 이곳에서 확인할 수 있다.