테크레시피

구글 제미니 프로, API 기업 사용 가능해졌다

구글은 12월 6일 문자와 음성, 이미지를 동시에 처리할 수 있는 멀티모달 AI인 제미니(Gemini)를 발표했다. 12월 13일 제미니 미들 모델인 제미니 프로가 API를 통해 액세스가 가능해져 개발자나 기업이 독자적인 사용례를 구축할 수 있게 됐다.

제미니 프로는 구글 멀티모달 AI인 제미니 미들 모델로 이미 대화형 AI인 바드 영어권 사용자는 텍스트 기반 프롬프트로 제미니 프로에 액세스할 수 있다. 구글에 따르면 제미니 프로는 벤치마크에서 다른 모델보다 뛰어나고 현재 버전에는 3만 2,000토큰 문맥 윈도가 포함되어 있다고 한다. 전 세계 180개국 이상에서 38개 언어를 지원하며 함수 호출, 임베디드, 시맨틱 검색, 커스텀 지식, 그라운드, 채팅 기능 등도 탑재되어 있다. 12월 13일 제미니 프로가 제미니 API를 통해 액세스할 수 있게 됐으며 개발자와 기업이 자체 사용례를 위해 제미니 프로를 맞춤 설정할 수 있게 됐다고 발표했다.

또 제미니 프로는 앱을 구축하는데 도움이 되는 SDK를 제공하며 파이썬, 안드로이드, 노드.js, 스위프트, 자바스크립트를 지원한다. 개발자나 기업은 API 키를 사용해 앱 프로토타입을 작성하기 위한 웹 기반 개발 도구인 구글 AI 스튜디오(Google AI Studio)를 통해 제미니 프로 API 키를 취득할 수 있다고 한다. 구글 계정으로 구글 AI 스튜디오에 로그인하면 분당 60개 쿼리 무료 할당량을 사용할 수 있지만 서비스 품질 향상을 위해 익명화된 입출력 데이터가 이용될 수 있다고 한다.

현재 제미니 프로는 텍스트 입력에 대한 텍스트를 생성할 수 있으며 텍스트와 이미지를 입력해 텍스트 출력을 수행하는 전용 제미니 프로 비전 멀티모달 엔드포인트도 제공한다. 또 대규모 언어 모델 최적화도 가능한 기계학습 플랫폼인 버텍스 AI(Vertex AI)에서도 기업 독자적인 데이터를 이용해 제미니를 커스터마이징할 수 있게 됐다. 구글은 버텍스 AI 사용자 입출력으로 모델을 학습하지 않아 기업은 데이터를 완벽하게 제어하면서 제미니를 맞춤 설정할 수 있다.

현재 개발자는 구글 AI 스튜디오를 통해 제미니 프로와 제미니 프로 비전에 무료로 액세스할 수 있으며 분당 최대 60개 쿼리를 사용할 수 있다. 2024년 초 일반 제공을 시작할 때까지 이 속도 제한으로 무료 평가판을 이용할 수 있으며 이후 구글 AI 스튜디오와 버텍스 AI에선 1,000자마다 또는 이미지 1장당 요금이 부과될 예정이다.

또 구글 클라우드 이미지 생성 기능을 크게 업그레이드한 이메진2(Imagen 2)도 발표해 허용 목록에 등록된 버텍스AI 사용자가 쓸 수 있다. 이메진2는 기존 모델보다 이미지와 텍스트 이해가 높아져 텍스트로부터 더 고품질 이미지를 생성할 수 있다고 한다. 이미지에 텍스트를 올바르게 쓰는 능력도 높아져 조직이 이미지 내에서 브랜딩과 메시지를 더 제어할 수 있다. 브랜드와 제품에 사용되는 엠블럼이나 로고 생성도 가능해졌다.

그 밖에 의료 업계 사용에 미세 조정한 대규모 언어 모델인 메드LM(MedLM)도 버텍스AI를 통해 미국 구글 클라우드 사용자에게 제공하기 시작했다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독