테크레시피

GPT-4.5 출시한 오픈AI “지금까지 나온 최고 대화 모델”

오픈AI가 대규모 언어 모델 GPT-4.5를 2월 27일에 출시했다. 오픈AI는 GPT-4.5를 최대이자 최고 대화 모델로 더 넓은 지식 기반을 갖고 있으며 더 자연스러운 대화가 가능하다고 평가하며 실용적인 용도에서의 우위성을 강조했다.

GPT-4.5는 사전 학습과 후학습 스케일링을 통해 개발된 모델로 패턴 인식, 관련성 파악, 창의적인 통찰력 생성 능력이 향상됐다. 기본 접근 방식으로는 명시적인 라벨이 있는 데이터 없이 패턴을 학습하는 비지도 학습이 채택됐으며 대량 텍스트 데이터에서 언어 패턴을 자기 학습하고 직관적으로 답변을 생성하는 구조로 되어 있다.

이미 출시된 오픈AI o1이나 o3-미니는 추론 모델로 답변하기 전에 생각하는 단계를 거친다. 반면 GPT-4.5는 비지도 학습에 특화되어 있어 답변 전에 생각하는 단계 없이 직접 응답한다. 이는 일종의 지금까지의 경험에서 즉시 답을 내는 것과 같다고 오픈AI는 설명했다. 비지도 학습 강점은 대화가 더 자연스럽고 유창하며 감정적인 뉘앙스를 이해할 수 있다는 것이다. 또 폭넓은 지식 기반으로 다양한 주제에 대응할 수 있어 창의적인 글쓰기나 디자인 지원에 뛰어나다.

오픈AI는 GPT-4.5를 개발하는 데 있어 계산 능력과 데이터 확장을 중시했다. 마이크로소프트 애저 AI 슈퍼컴퓨터를 활용하고 가능한 한 많은 계산 능력과 대량 데이터를 투입해 아키텍처와 최적화를 개선해 더 높은 수준 언어 이해를 실현했다고 설명했다. 오픈AI가 개발한 언어 모델 사실성을 측정하는 벤치마크(SimpleQA)에서 GPT-4.5, GPT-4o, o1, o3-미니 정확성과 할루시네이션 비율을 비교해보면 정확성은 GPT-4.5가 가장 높고, 사실에 기반하지 않은 정보를 답변하는 할루시네이션 비율은 GPT-4.5가 가장 낮은 결과를 보인다.

한편 GPT-4.5와 같은 비지도 학습 모델은 복잡한 수학 문제를 푸는 등 논리적 해결력이 낮고 단계적인 논리 전개가 필요한 문제에서는 정확도가 떨어진다. 다음은 GPT-4.5와 GPT-4o, o3-mini(high)로 각종 벤치마크를 수행한 결과를 비교해보면 수학과 과학 분야 작업에서는 GPT-4.5보다 OpenAI o3-mini(high)가 크게 뛰어나다는 게 더 명확해진다. 최신 추론 모델인 o3-mini(high)는 GPT-4.5보다 GPQA(과학), AIME ’24(수학), SWE-Bench Verified(코딩)에서 점수가 더 높다.

오픈AI는 GPT-4.5와 같은 비지도 학습을 확장한 모델이 더 나은 추론 모델이나 도구 활용 에이전트 기반이 될 것이라고 생각하고 있으며 향후 비지도 학습과 추론이라는 2가지 접근 방식이 상호 보완적이 될 것으로 예측하고 있다. 오픈AI는 비지도 학습 규모 확대가 미지의 능력 발견으로 이어지는 탐색적 접근법으로 위치시키고 있으며 앞으로도 이 방향성으로 연구를 계속할 것임을 시사했다. GPT-4.5는 먼저 연구 프리뷰로 챗GPT 프로 사용자와 개발자용 API로 공개됐으며 3월부터 다른(Plus, Team, Enterprise, Edu) 사용자에게도 단계적으로 제공될 예정이다. 다만 GPT-4.5가 크고 계산 집약적인 모델이며 GPT-4o보다 비용이 높기 때문에 오픈AI는 장기적인 API 제공에 대해서는 보장하지 않고 있다. 관련 내용은 이곳에서 확인할 수 있다.

한편 이렇게 2월 27일 오픈AI가 대규모 언어 모델 GPT-4.5를 발표했지만 GPU 부족으로 인해 출시가 지연되고 있음이 밝혀졌다.

오픈AI 샘 알트만 CEO는 GPT-4.5 발표와 관련해 엑스에 GPT-4.5가 준비 완료됐다며 좋은 소식은 GPT-4.5가 자신에게 있어 사려 깊은 사람과 대화하는 것처럼 느껴지는 첫 모델이라는 점이면서 의자에 앉아 있으면서 AI로부터 실제로 좋은 조언을 받고 놀란 적이 몇 번 있었다고 밝혔다. 이어 나쁜 소식은 GPT-4.5가 거대하고 비용이 많이 드는 모델이라는 점이라면서 GPT-4.5를 챗GPT 플러스와 챗GPT 프로 사용자를 위해 동시에 출시하고 싶었지만 급격한 성장으로 인해 GPU가 부족하다면서 다음 주에는 GPU 수만 개를 추가해 챗GPT 플러스 사용자에게도 제공할 수 있게 될 예정이라고 밝혔다. 곧 GPU 수십만 개가 추가될 예정이지만 사용자가 자사가 모은 모든 GPU를 사용하게 될 것이라 확신한다고 게시했으며 만성적인 GPU 부족으로 GPT-4.5를 일부 사용자에게만 제공할 수 있다고 언급했다.

오픈AI에 따르면 GPT-4.5는 입력 토큰 100만 개당 75달러, 출력 토큰 100만 개당 150달러 비용이 든다. 반면 GPT-4o는 입력 토큰 100만 개당 2.5달러, 출력 토큰 100만 개당 10달러 비용만 든다고 한다.

만성적인 오픈AI 측 GPU 부족에 대해 보도에선 이런 GPU 부족이 오픈AI가 브로드컴과 협력해 독자적인 AI 실리콘을 개발하는 원동력이 되고 있음이 분명하다고 지적했다.

한편 오픈AI가 자체 제작 칩을 출시할 수 있게 되기까지는 수년이 걸릴 것이므로 당분간은 수요를 충족시키기 위해 엔비디아 등 반도체 제조업체에 의존할 수밖에 없는 게 현실이라고 지적했다. 따라서 여전히 AI 붐은 엔비디아를 계속해서 뒷받침할 것으로 예상하고 있다. 실제로 엔비디아가 발표한 GPU 아키텍처 블랙웰(Blackwell)을 채택한 신형 GPU는 2025년 10월분까지 이미 매진 상태라고 한다. 또 여러 조직 및 개인이 대규모 데이터센터 확장을 계획하고 있어 엔비디아는 앞으로 수년간 호조를 유지할 것이라고도 지적했다. 실제로 마이크로소프트와 오픈AI는 AI 데이터센터를 설립하는 스타게이트(Stargate) 프로젝트를 진행 중이며 일론 머스크는 콜로서스(Colossus)에 GPU를 100만 개 이상 추가할 계획이라고 보도되고 있다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독

Most popular