테크레시피

오픈AI, 챗GPT 완전 통합한 달리3 발표했다

오픈AI가 이미지 생성 AI인 달리3(DALL-E 3)을 9월 20일 발표했다. 달리3은 대규모 언어 모델인 GPT를 기반으로 한 챗봇 AI로 챗GPT와 통합된 것이 특징. 10월에는 챗GPT 플러스와 엔터프라이즈 고객에게 제공할 예정이다.

달리는 오픈AI에 의해 2021년 발표된 이미지 생성 AI로 프롬프트라는 텍스트 입력에 따라 내용 속 이미지를 출력할 수 있다. 달리 언어 처리에는 오픈AI 대규모 언어 모델인 GPT-3 파라미터가 사용된다.

2022년에는 달리 개선판인 달리2가 등장했다. 이 달리2는 달리보다 고해상도 이미지를 저지연으로 생성할 수 있으며 또 사진 일부 영역을 지정해 편집을 실시하는 인페인팅(Inpainting) 기능이 추가됐다.

이번에 발표된 달리3도 텍스트에서 이미지를 생성하는 AI지만 GPT를 기반으로 개발된 채팅봇인 챗GPT를 기반으로 구축되어 있는 게 특징이다. 달리는 유료 플랜인 챗GPT 플러스 통합 기능으로 제공되며 챗GPT에게 말을 거는 형태로 이미지 프롬프트를 입력해 챗GPT가 이미지를 생성해준다.

오픈AI는 현재 이미지 생성 AI는 텍스트에서 이미지를 생성할 때 일부 단어나 설명을 무시하는 경향이 있었기 때문에 사용자는 프롬프트 엔지니어링을 요구받았다며 달리3는 제공 텍스트에 올바르게 대응하는 이미지를 생성하는 능력이 비약적으로 진보했다고 밝혔다.

오픈AI는 또 달리3에 대해 폭력적 내용이나 성인용 콘텐츠 또는 증오가 가득한 콘텐츠를 생성하는 능력에 제한을 두고 있다고 말한다. 더구나 생존한 아티스트 화풍을 요구하는 요청을 거부하도록 설계되어 있어 크리에이터는 전용 폼으로 이미지 생성 모델 학습에서 자신의 이미지를 뺄 수 있게 됐다고 한다.

오픈AI는 달리3에서 생성한 이미지 예제도 입력 텍스트와 함께 공개했다. 달리3은 현재 리서치 프리뷰 상태로 10월 초 챗GPT 플러스와 엔터프라이즈 고객에게 제공 예정이며 2023년 가을 후반에는 랩(Labs Open AI)에서도 공개된다. 또 달리2와 마찬가지로 달리3이 생성한 이미지는 고객이 사용하는 것으로 전재나 판매, 상품화에 오픈AI 허가는 필요 없다고 밝히고 있다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독