테크레시피

“GPT-4o보다 성능 압도적” 주장…xAI, 그록-3 출시

xAI가 2월 18일 그록-3(Grok-3)를 발표했다. xAI는 그록-3가 이전 모델보다 10배 이상 연산 능력을 갖추고 있으며 GPT-4o와 제미나이 2.0 프로보다 압도적으로 성능이 뛰어나다고 주장했다.

그록-3에는 2가지 추론 모드가 있다. 요청을 해결할 때 그록 추론을 표시하는 씽크(Think)와 더 많은 연산 능력이 필요한 복잡한 작업을 위한 빅 브레인(Big Brain)이 준비되어 있다.

빅 브레인 모드는 버튼이 없었지만 그록-3에 따르면 프롬프트에 빅 브레인 모드로 답변해달라고 지정하면 사용할 수 있다고 한다. 현재 도움말 페이지 등이 존재하지 않아 그록-3 조언이 맞는지는 불분명하다.

그록-3는 멀티모달 모델인 만큼 텍스트뿐만 아니라 이미지와 PDF 파일 등도 읽을 수 있다. 또 xAI는 인터넷과 엑스를 스캔해 사용자 질문에 대해 상세한 답변을 제공하는 딥서치(DeepSearch)도 출시했다. 이는 사용자가 그록-3에 질문을 입력하면 먼저 해당 질문 의도와 키워드를 분석하고 질문이 뭘 요구하는지 이해한 뒤 적절한 검색 쿼리를 생성해 AI 모델이 필터링한 뒤 답변을 생성해주는 기능이다. 딥서치도 검색 중 추론이 시각화되어 있다.

그록-3는 그록-3와 그록-3 미니라는 2가지 모델이 존재한다고 한다. xAI는 다음 게시물에서 그록-3와 그록-3 미니, 제미나이-2 프로와 딥시크(DeepSeek) V3, 클로드 3.5 소넷, GPT-4o 벤치마크 결과를 비교한 그래프를 제시했다. 이에 따르면 그록-3와 그록-3 미니는 수학(AIME), 과학(GPQA), 코딩(LCB)을 포함한 여러 테스트에서 제미나이-2 프로나 딥시크-V3, 클로드 3.5 소넷, GPT-4o를 포함한 경쟁사를 앞섰다고 한다.

머스크는 프레젠테이션 서두에서 xAI와 그록 사명은 우주를 이해하는 것이라며 무슨 일이 일어나고 있는지 외계인은 어디에 있는지, 인생의 의미는 무엇인지, 우주는 어떻게 끝나는지, 우주는 어떻게 시작됐는지 그런 의문에 답하고 싶다며 물론 그 진실이 정치적으로 올바른 것과 모순되더라도 그록은 최대한 진실을 추구하는 AI가 될 것이라고 덧붙였다.

그록-3는 현재 스마트폰용 그록 앱에서 이용할 수 있다. 다만 그록-3를 이용하려면 유료 구독인 엑스 프리미엄 플러스 이상에 가입해야 한다.

한편 엑스는 그록-3를 출시한 직후 미국에서의 엑스 프리미엄 플러스 가격을 월 22달러에서 40달러로, 연간 229달러에서 395달러로 인상했다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독

Most popular