테크레시피

“사법시험 상위 10% 수준” GPT-4 나왔다

3월 14일 오픈AI가 GPT-4를 정식 발표했다. GPT-4는 텍스트 뿐 아니라 이미지 입력도 가능한 멀티 모달 AI로 개발해 인간용 시험 문제를 풀거나 의뢰에 따라 프로그래밍하고 이미지 중 어떤 게 재미있는지 등 질문에 답할 수 있다. 더구나 영어 외 언어 성능도 고도 영역에 도달하고 있다고 한다.

오픈AI는 지금까지도 채팅AI인 챗GPT 등 고성능 AI를 개발해왔지만 이번에 발표된 GPT-4 성능은 기존 AI를 크게 웃돌고 있다고 한다. 오픈AI와 협력 관계에 있는 마이크로소프트는 GPT-4를 초대 아이폰이 등장할 때와 같은 충격을 주는 존재라고 평가하고 있다.

GPT-3.5를 기반으로 한 챗GPT는 사법 시험에서 하위 10%에 들어가는 성능을 갖췄지만 GPT-4에선 사법 시험에서 상위 10%에 들어가는 놀라운 성능을 발휘한다고 한다. 오픈AI가 공개한 득점표를 확인하면 사법시험(Uniform Bar Exam, LSAT)이나 SAT 같은 학력 테스트에서 GPT-4는 GPT-3.5를 크게 웃도는 득점을 기록한다. 또 이런 테스트는 테스트용으로 특별한 튜닝을 실시하지 않은 상태에서 이뤄졌다고 한다.

AI 성능을 평가하는 벤치마크에서도 GPT-4는 GPT-3.5를 크게 웃도는 점수를 기록했다. 또 GPT-4는 영어 외 언어에서도 높은 성능을 발휘한다. 언어별 성능에서도 GPT-4로 한국어를 처리했을 때 성능은 GPT-3.5 영어가 70.1%인데 비해 77%로 더 높다.

GPT-4에선 텍스트 뿐 아니라 이미지도 인식할 수 있다. 예를 들어 GPT-4에 이미지를 보여주면서 일반적이지 않은 포인트를 물으면 정확하게 대답을 해준다. 또 GPT-3.5를 탑재한 챗GPT에선 소스 코드를 작성해주는 조작이 가능했다 GPT-4에선 소스 코드 기술 기능이 더 세련되어 상호 작용하면서 소프트웨어를 완성시킬 수 있다.

GPT-4는 이미 유료 서비스인 챗GPT 플러스 회원을 위해 공개됐다. GPT-4 API 목록을 통해 등록할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

한편 마이크로소프트는 GPT-4 발표 직후 자사가 빙(Bing)에 통합한 채팅 AI는 GPT-4라고 밝혔다. GPT-4 발표보다 먼저 사용자가 GPT-4를 이용한 AI 툴을 사용하고 있었다는 것이다.

지난 2월 마이크로소프트는 검색엔진 빙과 웹브라우저 엣지에 챗GPT 업그레이드 버전 AI를 통합한다고 발표한 바 있다. 마이크로소프트는 챗GPT 업그레이드 버전 AI에 대해 챗GPT보다 강력하고 검색을 위해 맞춤화된 차세대 오픈AI 대규모 언어 모델을 사용한다며 이 모델은 챗GPT와 GPT-3.5 중요한 학습과 진보를 도입해 이들보다 더 빠르고 정확하며 기능적이라고 밝혔지만 구체적으로 어떤 AI 모델을 사용하고 있었는지에 대해선 밝히지 않았다.

채팅AI를 통합한 빙의 주목도는 높았다. 이후 마이크로소프트는 빙에 통합된 채팅AI를 스카이프나 윈도11 작업표시줄 등에 통합한다고 발표했다.

이런 빙 채팅AI에 대해 마이크로소프트 소비자 마케팅 책임자가 빙 AI가 오픈AI가 발표한 GPT-4를 사용 중이라고 밝힌 것. 오픈AI가 GPT-4를 업데이트하면 빙은 개선을 통해 혜택을 누릴 수 있으며 가장 포괄적인 코파일럿 기능을 이용할 수 있다는 걸 보증할 수 있다는 것. 덧붙여 마이크로소프트는 빙 채팅AI를 발표한 뒤 AI에 1일 50개 메시지까지, 1회 대화 교환 5회까지, 빙 AI 자체에 대한 질문 금지 등 제한을 부과했다가 3월 15일 이 제한을 1일 150메시지까지로 완화한 바 있다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독

Most popular