
구글이 차세대 추론 AI인 제미나이 2.5(Gemini 2.5) 시리즈를 발표하고 첫 번째 모델로 멀티모달 모델인 제미나이 2.5 프로 익스페리멘탈(Gemini 2.5 Pro Experimental)을 공개한다고 밝혔다. 구글은 강력한 추론 기능과 코드 처리 능력을 갖춘 이 모델이 지금까지 출시된 모델 중에서 가장 지능적이라고 강조하고 있다.
기존 대규모 언어 모델(LLM)은 수학 문제나 코딩과 같은 논리적 사고를 요구하는 복잡한 작업에 취약했다. 하지만 추론 AI 모델은 답을 도출하기 전에 추가 연산 능력과 시간을 활용해 사실을 확인하고 문제를 분석, 수학 문제나 코딩 작업에서도 높은 정확도 결과를 제공할 수 있다.
2024년 9월 오픈AI가 첫 AI 추론 모델인 오픈AI o1을 발표한 이후 AI 기업은 이를 능가하는 추론 능력을 확보하기 위해 경쟁을 벌이고 있다. 현재 오픈AI 외에도 앤트로픽, xAI, 딥시크 등이 자체적인 추론 모델을 개발 중이다.
구글 역시 추론 모델 개발을 진행해왔으며 2024년 12월에는 첫 번째 추론 모델인 제미나이 2.0 플래시 씽킹(Gemini 2.0 Flash Thinking)을 출시했다. 이 모델은 멀티모달 모델인 제미나이 2.0 플래시에 사고 과정을 생성하는 기능을 추가한 게 특징이다.
구글에 따르면 이번에 발표된 제미나이 2.5 시리즈는 기존 제미나이 2.0 플래시 씽킹보다 더욱 강화된 추론 및 코딩 능력을 제공한다.
구글이 공개한 벤치마크 결과에 따르면 추론 및 지식, 과학, 수학 부문에서 오픈AI o3-mini, 오픈AI GPT-4.5, 클로드 3.7 소넷, Grok 3 Beta, DeepSeek-R1 등과 비교해 최상위권의 성능을 기록했다.
또 코드 편집 성능을 측정하는 평가 도구(Aider Polyglot)에서 제미나이 2.5 프로 익스페리멘탈은 68.6% 점수를 획득하며 앞서 비교한 다른 모델보다 높은 성능을 보였다. AI 소프트웨어 개발 벤치마크(SWE-Bench Verified)에서는 63.8% 점수를 기록하며 오픈AI o3-mini 및 DeepSeek-R1보다 뛰어난 성능을 보였지만 70.3%를 기록한 앤트로픽 클로드 3.7 소넷보다는 다소 낮은 결과를 보였다.
구글은 제미나이 2.5 프로 익스페리멘탈이 1줄 프롬프트 입력만으로 간단한 게임을 생성하는 모습을 시연하는 영상을 공개하기도 했다.
제미나이 2.5 프로는 현재 입력 토큰 100만 개, 출력 토큰 6만 4,000개를 지원하며 개발자 플랫폼인 구글 AI 스튜디오에서 사용할 수 있다. 또 유료 요금제인 제미나이 어드밴스드(Gemini Advanced) 가입자는 제미나이 앱에서도 이용 가능하다. API 이용 요금에 대한 정보는 아직 공개되지 않았으며 구글은 조만간 세부 사항을 발표할 계획이다. 관련 내용은 이곳에서 확인할 수 있다.