테크레시피

“더 오래 생각하고 정확하게” 오픈AI o3-프로 나왔다

오픈AI가 6월 11일 추론 모델 o3 강화판인 o3-프로(o3-pro)를 공개했다. o3를 기반으로 하면서도 더 오래 사고해 답변 정확성을 중시하는 설계로 되어 있다.

o3는 지난 4월 오픈AI가 발표한 AI 모델로 수학과 코딩, 추론, 과학, 시각 이해 능력을 측정하는 벤치마크에서 기존 모델을 뛰어넘는 성능을 발휘해 오픈AI 역사상 가장 고도의 추론 모델로 평가받고 있다.

o3-프로는 o3를 기반으로 한 모델로 웹 검색이나 파일 분석, 시각적 입력 추론, 파이썬 사용, 메모리를 활용한 응답 개인화 등이 가능하다. 속도보다는 신뢰성을 중시하며 더 오래 추론을 수행하고 신뢰성 높은 답변을 출력하도록 설계됐다고 한다. 따라서 응답 완료에는 이전 세대 o1-프로보다 시간이 걸리지만 오픈AI는 이런 몇 분을 기다릴 만한 가치가 있는 난제에 사용할 걸 권한다고 밝혔다.

전문가 평가에서는 테스트된 모든 카테고리 그 중에서도 과학, 교육, 프로그래밍, 비즈니스, 라이팅 지원 등 주요 분야에서 o3-프로가 o3보다 일관되게 높은 평가를 받았다. 또 o3-프로는 명확성, 포괄성, 지시 준수, 정확성에서도 일관되게 높은 평가를 얻었다고 한다.

오픈AI는 또 수학·과학·코딩 벤치마크에서 o3-프로가 o1-프로와 o3 모두를 일관되게 뛰어넘었다고 보고했다.

더 엄격하게 신뢰성을 평가하기 위해 4회 시행해 모든 질문에 올바르게 답한 경우에만 정답으로 평가하는 방법으로 확인한 결과도 공개했다. 수학·과학·코딩 모든 분야에서 o3-프로가 가장 높은 성적을 기록했다.

o3-프로는 챗GPT 프로 및 팀(Team) 사용자를 대상으로 기존 o1-프로를 대체하는 형태로 제공된다. 엔터프라이즈 및 에듀 사용자에게는 그 다음 주부터 제공이 시작된다고 한다. 개발자용 API는 입력 토큰 100만 개당 20달러, 출력 토큰 100만 개당 80달러다.

다만 현재 오픈AI는 기술적 문제 해결에 임하고 있다며 챗GPT 내에서의 o3-프로와의 임시 채팅을 비활성화했다. 또 o3-프로는 이미지를 생성할 수 없으며 오픈AI AI를 활용한 워크스페이스 기능인 캔버스(Canvas)는 o3-프로에서 지원되지 않는다. 관련 내용은 이곳에서 확인할 수 있다.

한편 보도에 따르면 AI가 빠르게 보급되면서 전 세계 데이터센터 에너지 수요가 2026년까지 한 국가 소비전력에 맞먹을 정도로 증가할 것으로 예측되고 있으며 에너지 뿐 아니라 데이터센터 냉각 시스템에 필요한 수자원 소비도 문제로 지적되고 있다. 오픈AI 샘 알트만 CEO가 챗GPT 쿼리가 사용하는 평균적인 물량은 0.32ml라고 공개했다.

알트만 CEO는 6월 11일 블로그 게시물에서 사건의 지평선을 넘어 날아오르고 있으며 인류는 디지털 초지능 구축에 가까워지고 있지만 적어도 지금까지는 예상만큼 기이한 일이 일어나지 않고 있다면서 예를 들어 아직 로봇이 거리를 걸어 다니지 않고 대부분은 하루 종일 AI와 대화하지 않는다고 밝혔다. 이어 또 여전히 질병으로 목숨을 잃고 있으며 우주에 쉽게 갈 수 없고 그곳에는 인류가 아직 모르는 게 많이 남아있다며 기술적 특이점은 갑작스럽게 일어나는 게 아니라 온화한 변화로서 도래할 것이라고 예측했다.

한편 AI는 이미 다양한 형태로 세계에 기여하고 있으며 과학자로부터 AI 도입 전과 비교해 생산성이 2~3배 향상됐다는 목소리가 나오는 등 챗GPT는 지금까지 살아온 그 어떤 인간보다도 강력한 존재가 되어가고 있다.

또 소프트웨어인 AI가 로봇 등 하드웨어를 만들 수 있게 된다면 기술 발전은 비약적으로 가속화될 것으로 여겨진다. 이런 AI의 자기복제를 알트만 CEO는 AI 시스템을 운영하기 위한 인프라 구축을 복리적으로 진행하는 플라이휠이라고 표현하며 AI 인프라가 AI에 의해 구축되는 것도 그리 멀지 않았다고 내다봤다.

그에 따르면 데이터센터를 건설하는 데이터센터라고 부르는 것과 같은 AI에 의한 AI 시스템 구축 체제가 실현될 경우 AI를 운영하는 비용도 크게 절감될 가능성이 있다고 한다.

알트만은 데이터센터 운용이 자동화됨에 따라 지능 비용은 최종적으로 전기료와 동일한 수준으로 수렴할 것이라며 많은 이들이 챗GPT 쿼리가 얼마나 많은 에너지를 소비하는지에 관심을 갖고 있는데 평균적인 쿼리는 0.34와트시로 이는 오븐이 1초 조금 넘게 소비하는 전력이나 고효율 전구가 몇 분간 소비하는 전력과 거의 같다면서 또 0.000085갤런 물도 소비하는데 이는 티스푼 15분의 1 정도라고 밝혔다.

AI가 얼마나 많은 물을 소비하는지는 데이터센터 소재지에 따라 다르지만 2024년 AI 연구자가 산출한 데이터에 따르면 GPT-4를 사용한 AI 챗봇으로 생성된 100단어 이메일 문서에는 페트병 1개 이상 물이 필요하다고 한다.

알트만은 AI 운영비용을 절감하고 초지능에 대한 접근을 널리 보급시키는 건 AI로 인한 심각한 위험을 회피하기 위한 최선책 중 하나라고 생각하고 있다. 그는 미터로 측정하기에는 너무 저렴한 지능이 이제 손이 닿는 곳에 있다면서 이런 말을 하는 게 미친 소리로 들릴 수도 있지만 만일 2020년 당시 2025년 현재 상황을 예언했다면 아마도 2030년에 관한 현재 예상보다 더 미친 이야기로 들렸을 것이라면서 초지능을 통해 지수함수적으로 그리고 무사히 스케일업해 나갈 수 있기를 바란다고 마무리했다. 관련 내용은 이곳에서 확인할 수 있다.

이원영 기자

컴퓨터 전문 월간지인 편집장을 지내고 가격비교쇼핑몰 다나와를 거치며 인터넷 비즈니스 기획 관련 업무를 두루 섭렵했다. 현재는 디지털 IT에 아날로그 감성을 접목해 수작업으로 마우스 패드를 제작 · 판매하는 상상공작소(www.glasspad.co.kr)를 직접 운영하고 있다. 동시에 IT와 기술의 새로운 만남을 즐기는 마음으로 칼럼니스트로도 활동 중이다.

뉴스레터 구독

Most popular