테크레시피

구글, 제미나이 이미지 생성 기능 모델 도입 발표

구글은 8월 28일 발표에서 제미나이의 창의적인 이미지 생성 기능을 업그레이드하고 앞으로 며칠 내에 최신 이미지 생성 모델인 이메진3(Imagen 3)을 제미나이에 도입해 모든 언어 사용자에게 제공할 예정이라고 밝혔다. 8월 16일에 출시된 이메진3은 이전 모델인 이메진2보다 프롬프트 이해력이 향상됐으며 텍스트 렌더링 능력도 대폭 개선된 게 특징이다.

구글은 이메진3에 대해 짧은 프롬프트만으로도 이미지를 생성할 수 있으며 생성된 이미지는 새로운 기준을 제시한다며 제미나이와 대화하면서 현실적인 풍경이나 질감이 뛰어난 유화 등 다양한 이미지를 생성할 수 있다고 설명했다.

구글은 또 며칠 내에 유료 버전인 제미나이 어드밴스드(Gemini Advanced), 비즈니스(Business), 엔터프라이즈(Enterprise) 사용자에게 인물 이미지 생성 기능을 다시 제공할 예정이라고 발표했다. 구글은 지난 2월 역사적인 이미지 묘사에서 부정확함이 있다는 비판을 받고 다양한 결과를 생성하려던 시도가 부적절한 결과를 낳았다며 사과한 뒤 이 기능을 일시 중단한 바 있다.

구글은 이후 제미나이가 다양한 인물을 묘사하려는 시도로 인해 명백히 하지 말아야 할 경우를 설명하지 못했다며 시간이 지나면서 제미나이는 더 신중해졌고 특정 프롬프트에 대한 응답을 완전히 거부하게 됐다고 설명했다. 이 문제를 해결하기 위해 인물 이미지 생성 기능을 비활성화하고 광범위한 테스트를 포함한 개선 작업을 진행했다고 보고했다.

이번 발표에서 구글은 자사는 제품에 대한 기술적 개선, 평가 세트 향상, 레드팀 훈련, 명확한 제품 원칙 수립에 주력해 왔다며 인물 이미지 생성 기능 재개를 알렸다. 또 이메진3은 인물 이미지를 생성할 때 사용자 경험을 향상시키는 큰 진전을 이뤘으며 현실적이고 식별 가능한 개인이나 미성년자, 과도한 폭력, 잔혹함, 성적인 장면 생성을 지원하지 않는다며 다른 생성 AI와 마찬가지로 제미나이가 생성하는 모든 이미지가 완벽하지는 않지만 사용자 피드백에 귀 기울이며 지속적으로 개선해 나갈 것이며 더 많은 사용자와 언어에 인물 이미지 생성 기능을 제공하는 게 목표라고 말했다.

구글은 또한 제미나이를 사용자 맞춤형으로 설정해 자신만의 챗봇을 만들 수 있는 새 기능인 젬(Gem)을 제미나이 어드밴스드, 비즈니스, 엔터프라이즈 사용자에게 제공하기 시작했다고 발표했다. 젬은 지난 5월 구글 I/O에서 발표된 기능으로 오픈AI 챗GPT가 제공하는 GPTs와 유사하게 자신만의 챗봇을 만들 수 있다.

구글은 젬은 상세한 일련의 지시를 기억할 수 있어 지루하고 반복적인 작업이나 어려운 작업에 소요되는 시간을 절약할 수 있다고 설명했다. 또 젬에는 생일 선물 아이디어를 제공하는 아이디어 전문가나 경력 목표 달성을 위해 계획을 수립할 수 있는 커리어 어드바이저 같은 샘플이 제공되고 있다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독