구글이 12월 16일 이미지를 입력해 다양한 이미지를 생성할 수 있는 새로운 이미지 생성 AI 위스크(Whisk)를 발표했다.
기존 이미지 생성 AI에서는 90년대 애니메이션 스타일의 ○○, 사이버펑크 스타일의 ○○와 같은 텍스트 프롬프트를 입력해야 했다. 하지만 이번에 발표된 위스크가 가진 특징은 텍스트 프롬프트를 입력할 필요가 없다는 점. 위스크를 사용해 이미지를 생성하려면 먼저 주요 피사체인 주제(Subject)에 이미지를 업로드한다. 기존 이미지 생성 AI와 마찬가지로 텍스트 프롬프트를 입력하는 것도 가능하다.
다음 장면(Scene)에서는 생성될 이미지 배경을 선택한다. 이때 원하는 이미지를 업로드할 수도 있고 무작위로 제시되는 선택지 중 하나를 선택할 수도 있다.
또 90년대 애니메이션 스타일과 같이 생성될 이미지 스타일을 결정하는 이미지를 업로드한다. 스타일(Style)도 주제(Subject)와 마찬가지로 텍스트 프롬프트 입력에 대응한다. 마지막으로 생성될 이미지 세부 사항을 텍스트로 입력한다. 그러면 업로드한 이미지를 리믹스한 이미지가 생성된다. 생성된 이미지에 마음에 들지 않는 부분이 있으면 재정의(REFINE) 버튼을 클릭한다. 나타난 텍스트 입력란에 내용을 입력하면 이를 바탕으로 수정된 이미지가 생성된다.
구글에 따르면 위스크는 구글 생성 AI인 제미나이를 사용해 업로드된 이미지에 대한 상세한 캡션을 자동 작성하고 이를 이미지 생성 모델인 이매진3(Imagen 3)에 입력해 간편한 이미지 생성이 가능하다고 한다.
구글은 위스크는 이미지에서 몇 가지 주요 특성만 추출하기 때문에 피사체 키나 체중, 머리 스타일, 피부색 등이 기대와는 다른 이미지가 생성될 수 있다. 따라서 위스크에서는 언제든지 프롬프트를 확인하고 편집할 수 있다고 말했다. 또 구글 부사장인 조시 우드워드는 위스크는 영화 제작자, 창의성을 중시하는 광고주, 패션 디자이너와의 대화를 바탕으로 만들어졌다고 말했다. 참고로 현재 위스크는 미국 사용자만 사용 가능하다. 관련 내용은 이곳에서 확인할 수 있다.