구글은 2024년 5월 빠르고 고성능인 경량 AI 모델 제미나이 1.5 플래시(Gemini 1.5 Flash)를 발표했다. 이를 더 경량화하고 가격을 낮춘 버전인 제미나이 1.5 플래시-8B(Gemini 1.5 Flash-8B) 제품 버전이 10월 3일 출시됐다.
구글이 발표한 AI 모델 제미나이 1.5 플래시는 벤치마크 테스트에서 제미나이 1.5 프로에 버금가는 성능을 자랑하면서도 제미나이 1.5 프로보다 훨씬 저렴하게 사용할 수 있다는 점이 특징.
구글은 출시 후 몇 개월 동안 제미나이 1.5 플래시를 개선해 더 작고 빠른 버전인 제미나이 1.5 플래시-8B를 개발했다. 제미나이 1.5 플래시-8B는 9월 실험 버전으로 출시됐으며 10월에는 제품 버전이 출시됐다. 제미나이 1.5 플래시-8B는 경량화된 모델임에도 불구하고 많은 벤치마크에서 제미나이 1.5 플래시와 동등한 성능을 발휘하고 있다고 한다.
제미나이 1.5 플래시-8B는 제미나이 시리즈 중 가장 저렴하게 이용할 수 있으며 구글은 제미나이 1.5 플래시와 비교해 50% 더 저렴하다고 말한다. 구체적인 비용은 프롬프트 입력 100만 토큰당 0.0375달러, 프롬프트 출력 100만 토큰당 0.15달러, 프롬프트 캐시 100만 토큰당 0.01달러이며 프롬프트가 12,800 토큰을 초과한 부분에 대해서는 각각 2배 금액이 부과된다.
유료 플랜 개발자의 경우 청구는 10월 14일부터 시작된다고 한다. 구글은 이 새로운 가격은 제미나이 1.5 플래시와 제미나이 1.5 프로에서 개발자 비용 절감을 위해 해온 작업과 함께 개발자가 세상을 발전시키는 제품과 서비스를 자유롭게 구축할 수 있도록 하는 약속을 강조한다고 말했다.
또 제미나이 1.5 플래시-8B는 작은 프롬프트에 대한 지연이 제미나이 1.5 플래시보다 더 낮아졌으며 속도 제한은 2배로 늘어났다고 한다. 개발자는 구글 AI 스튜디오와 제미나이 API를 통해 제미나이 1.5 플래시-8B에 접근할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.
한편 구글은 구글 렌즈에 검색 기능을 도입해 음성으로 질문할 수 있는 기능을 추가했다. 이로 인해 구글 측 실험적 기능을 사용할 수 있는 프로그램인 서치랩(Search Labs)에 등록한 사용자는 영상을 활용한 검색과 음성 질문을 결합해 보다 쉽게 실시간 검색을 할 수 있게 됐다.
구글은 지난 5월 개발자 회의인 구글 I/O에서 구글 렌즈 동영상 이해 기능을 발표했다. 이 기능은 특정 상황에서 스마트폰으로 영상을 촬영하면서 질문을 하면 AI 모델인 제미나이가 그 질문에 대한 답변을 제공해주는 방식이다. 예를 들어 수족관에서 물고기를 촬영하면서 저 물고기는 왜 같이 헤엄치냐고 질문하면 AI가 이에 대한 답변을 실시간으로 제공해준다.
서치랩에서 AI 기능 테스트에 참여한 사용자는 구글 렌즈 셔터 버튼을 길게 눌러 동영상을 촬영하고 그 상태에서 음성으로 질문을 할 수 있다. 또 검색 결과에서 마이크 아이콘을 눌러 추가 질문도 가능하다.
구글 엔지니어링 부사장인 라잔 파텔(Rajan Patel)은 이 기능에 대해 동영상을 일련의 이미지 프레임으로 캡처한 뒤 이를 제미나이 모델에 전달해 AI가 여러 프레임을 연속적으로 이해하고 웹 기반 응답을 생성한다고 설명했다.
현재 이 기능은 동영상 속 소리에 대해 질문하는 건 지원하지 않지만 구글은 새 기능에 대한 테스트를 진행 중이다. 예를 들어 새 소리를 녹음하고 그 새 종류를 묻는 기능은 아직 사용할 수 없다.
구글 렌즈 동영상 이해 기능은 전 세계의 안드로이드 및 iOS 사용자에게 제공되고 있으며 음성으로 질문하는 기능은 현재 영어만 지원하고 있다. 관련 내용은 이곳에서 확인할 수 있다.