입력한 텍스트에 따라 이미지를 생성하거나 이미지에서 다른 이미지를 생성할 수 있는 이미지 생성 AI인 스테이블 디퓨전을 이용해 다양한 인테리어 디자인을 AI에 생성하도록 하는 시도가 이뤄지고 있다.
이들에 따르면 이 시도는 스테이블 디퓨전 버전 2.0에 등장한 입력 이미지 깊이를 추측해 이미지를 출력할 수 있는 모델(Depth-Guided)을 이용해 모형으로 작성한 간이 인테리어를 기반으로 AI에 다양한 인테리어 디자인을 제안하고 있다.
이 모델은 스테이블 디퓨전의 img2img 기능을 강화하기 위해 추가한 것이다. 입력 이미지 깊이 정보를 추측해 이를 기반으로 다른 이미지를 생성하기 위해 원래 이미지 구도를 출력 화상에 진하게 반영할 수 있는 게 특징이다. 뎁스-가이디드 모델은 스테이블 디퓨전 2.0부터 미세 조정되어 있으며 심도 관련 추가 채널이 존재하기 때문에 독특하다고 할 수 있다. 또 이 모델은 단일 이미지로부터 깊이를 예측하는 모델 MiDaS을 이용하고 있다.
이미지를 생성할 때 입력하는 텍스트로 깊이 맵도 크게 변화한다. 이 때문에 입력하는 텍스트에는 어느 정도 창의성이 필요하다고 한다.