
오픈AI가 4월 14일 GPT-4.1, GPT-4.1 미니, GPT-4.1 나노 API를 발표했다. GPT-4.1 시리즈는 최대 100만 토큰 입력을 지원할 뿐 아니라 코딩과 지시 추적 능력이 GPT-4o 시리즈보다 대폭 개선됐으며 낮은 지연 시간과 높은 비용 효율성을 갖춘 모델이다.
GPT-4.1이 갖춘 가장 큰 특징은 최대 100만 토큰이라는 상당히 긴 컨텍스트 윈도를 지원한다는 것. 이를 통해 수백 페이지에 달하는 문서나 대규모 코드베이스를 한 번에 처리하고 내용을 유지한 채 적절하게 추론할 수 있게 됐다. 오픈AI는 이런 장문 처리 능력이 법무, 금융, 고객 지원 등 많은 실용 분야에서 중요하다고 밝혔다.
코딩에 관해서는 깃허브에서 수집한 이슈 해결로 코딩 능력을 측정하는 SWE-bench Verified에서 GPT-4.1은 54.6% 점수를 획득해 GPT-4o 33.2%를 크게 상회했다. 또 여러 언어에 걸친 코드 차이 생성에서도 높은 정확도를 기록했으며 파일 전체가 아닌 변경 부분만 출력해 개발 비용과 지연 시간을 줄였다고 한다.
지시를 따르는 능력을 측정하는 벤치마크(Scale’s MultiChallenge)에서 GPT-4.1은 38.3%라는 점수를 기록했다. 이는 GPT-4o보다 10.5% 포인트 향상된 결과다. 또 멀티모달 장시간 컨텍스트 이해 벤치마크(Video-MME)에서 GPT-4.1은 장시간・자막 없음 카테고리에서 72.0% 점수를 획득해 GPT-4o보다 6.7% 포인트 개선됐다. 형식 지정, 금지 사항, 출력 순서, 특정 정보 포함과 같은 다양한 지시 카테고리에서 GPT-4.1은 이전보다 정확하게 응답할 수 있게 됐으며 그 중에서도 난이도가 높은 프롬프트에서는 GPT-4o보다 큰 향상이 있었다고 오픈AI는 보고했다.
시각 정보 이해에서도 진화가 보이며 도표나 수식을 포함한 시각적 질문 응답 태스크에서도 높은 점수를 기록했다. 그 중에서도 GPT-4.1 미니 모델은 GPT-4o와 비교해 경량이면서도 이미지 처리 능력에서 앞서는 경우가 많아졌으며 비용이나 지연 시간을 줄이면서 높은 성능을 유지하고 있다.
또 응답 속도와 비용 효율성도 개선됐다. GPT-4.1은 기존 모델보다 최대 26% 비용이 낮으며 프롬프트 캐시를 통한 절감률도 75%로 확대됐다. 경량 모델인 미니와 나노도 함께 제공되어 낮은 지연 시간이나 비용 최적화가 필요한 용도에도 대응할 수 있다.
GPT-4.1 (and -mini and -nano) are now available in the API!
— Sam Altman (@sama) April 14, 2025
these models are great at coding, instruction following, and long context (1 million tokens).
benchmarks are strong, but we focused on real-world utility, and developers seem very happy.
GPT-4.1 family is API-only.
GPT-4.1은 이런 특성으로 인해 기존 한계를 넘어선 복잡한 태스크 자동화나 지능형 에이전트 구축을 가능하게 하며 API를 통한 이용에 최적화된 실용적인 AI 모델이 됐다.
GPT-4.1 시리즈는 현재 오픈AI API 플랫폼에서 제공되며 챗GPT에서의 이용은 대상이 아니다. 다만 챗GPT 내 GPT-4o에는 GPT-4.1에서 도입된 지시 추종이나 코드 생성 등 개선점이 단계적으로 통합되고 있다.
API 가격은 GPT-4의 경우 입력 2.00달러, 캐시된 입력 0.50달러, 출력 8.00달러, 블렌드 가격 1.84달러다.
GPT-4.1 등장으로 기존 GPT-4.5 프리뷰 모델은 7월 14일부로 API상에서 폐지될 예정이며 개발자에게는 이전 기간이 주어졌다. GPT-4.5는 처음에 컴퓨팅 리소스를 많이 사용하는 연구 프리뷰로 제공됐던 모델로 GPT-4.1이 여러 면에서 더 뛰어나다는 게 확인되어 단계적으로 대체될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.