
구글이 제미나이 2.5 모델 패밀리를 확장하면서 제미나이 2.5 프로와 제미나이 2.5 플래시를 안정화된 버전으로 일반에 공개했다. 이와 함께 현재까지 가장 빠르고 경제적인 모델로 설계된 제미나이 2.5 플래시 라이트(Gemini 2.5 Flash-Lite) 프리뷰 버전도 새롭게 발표했다.
제미나이 2.5는 고성능을 유지하면서도 비용과 처리 속도 측면에서 효율을 극대화한 하이브리드 추론 모델. 그중에서도 프로 모델은 구글이 개발한 모델 중 가장 성능이 높으며 고도의 코딩 및 추론 능력은 물론 최대 3시간 분량 영상 콘텐츠를 처리할 수 있는 멀티모달 이해 기능을 갖췄다.
프로 모델은 지난 5월 I/O 행사에서 기능을 강화한 프리뷰(I/O edition) 버전이 공개된 바 있다. 당시 코딩 성능은 향상됐지만 다른 항목에서 성능 저하가 지적됐고 이에 대해 구글 개발팀은 수정 약속을 밝힌 바 있다. 이번 정식 버전은 해당 수정이 반영된 상태다.
정식 공개된 제미나이 2.5 프로는 스마트폰용 제미나이 앱에서도 사용 가능하며 무료 이용자도 일부 제한된 접근을 할 수 있다. API 이용 가격은 입력 기준 100만 토큰당 1.25달러, 출력 기준 100만 토큰당 10.00달러다.
한편 제미나이 2.5 플래시는 지난 4월 발표된 모델로 컴퓨팅 자원과 지연 시간 요구를 낮춘 경량화 추론 모델이다. 프로 모델과 마찬가지로 텍스트·오디오·이미지·영상·코드 리포지토리 전체를 아우르는 100만 토큰 이상 긴 컨텍스트 입력을 지원하는 네이티브 멀티모달 모델로 설계됐다. 가격은 입력 기준 100만 토큰당 0.30달러, 출력 기준 2.50달러로 구글 AI 스튜디오와 버텍스 AI에서 이용할 수 있으며 제미나이 앱에서도 접근할 수 있다.
이번에 새롭게 발표된 제미나이 2.5 플래시 라이트는 플래시 계열 모델 중 가장 경량화되고 빠른 모델. 기존 제미나이 2.0 플래시 라이트보다 코딩, 수학, 과학, 추론, 멀티모달 벤치마크 전반에서 더 높은 품질을 제공한다. 그 중에서도 번역이나 분류와 같이 대규모 처리와 저지연성이 요구되는 작업에서 강한 성능을 보이며 응답 지연도 기존 플래시 라이트 및 플래시 모델보다 낮다.
플래시-라이트는 기본적으로 사고(Thinking) 모드가 꺼져 있지만 API 파라미터를 통해 활성화할 수 있다. 다른 제미나이 2.5 모델과 마찬가지로 다양한 예산에 맞춘 사고 모드 조절, 구글 검색 및 코드 실행 툴 연결, 멀티모달 입력, 최대 100만 토큰 긴 컨텍스트 길이를 지원한다. 구글은 플래시 라이트 목표를 초저지연 성능과 가격 대비 높은 처리량을 제공하는 경제형 모델 클래스라고 밝혔다.
플래시 라이트 API 가격은 입력 기준 100만 토큰당 0.10달러, 출력 기준 0.40달러다. 프리뷰 버전은 구글 AI 스튜디오와 버텍스AI에서 사용 가능하며 안정화된 프로 및 플래시 모델과 병행해 제공된다. 또 구글 검색 내 AI 요약 및 AI 모드 기능에도 플래시와 플래시 라이트 커스텀 버전이 탑재될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.