테크레시피

“GPT-4o 성능 필적” 클로드 3.5 소넷 나왔다

챗봇 AI인 클로드(Claude)를 개발하는 앤트로픽(Anthropic)이 새로운 모델인 클로드 3.5 소넷(Claude 3.5 Sonnet)을 6월 21일 발표했다. 이는 앞으로 출시될 클로드 3.5 제품군 첫 번째 모델로 벤치마크 결과가 오픈AI GPT-4o에 필적한다고 한다.

앤트로픽에 따르면 클로드 3.5 소넷은 대학원 수준 추론 능력, 대학 학부 수준 지식과 코딩 능력을 갖추고 있다고 한다. 앤트로픽 측은 클로드 3.5 오푸스 등 기존 클로드 모델과 비교해 뉘앙스와 유머, 복잡한 지시를 이해하는 능력이 현저히 향상됐으며 자연스럽고 친근한 어조로 고품질 콘텐츠를 작성하는 능력이 뛰어나다고 강조하고 있다.

클로드 3.5 소넷은 클로드 3 오푸스에 비해 성능과 비용 효율성이 향상됐으며 클로드 3.5 소넷 작동 속도는 클로드 3 오푸스 2배에 필적한다고 한다. 또 에이전트 코딩 평가에서 클로드 3.5 소넷은 문제 64%를 해결해 38%를 해결한 클로드 3 오푸스를 능가했다고 한다.

앤트로픽이 공개한 벤치마크 결과를 보면 클로드 3.5 소넷은 8개 항목 중 추론(GPQA), 지식(MMLU), 코딩(HumanEval), 수학 문제 번역(MGSM), 텍스트 추론(DROP) 등 5개 항목에서 GPT-4o와 동등하거나 그 이상 결과를 보여주고 있다.

앤트로픽은 클로드 3.5 소넷은 지금까지 가장 강력한 비전 모델이며 표준 비전 벤치마크에서 클로드 3 오푸스를 능가했다며 차트와 그래프 해석 등 시각적 추론이 필요한 작업에서 성능이 향상됐고 불완전한 이미지에서 텍스트를 정확히 작성할 수 있다고 강조했다.

앤트로픽은 또 Claude.ai에 아티팩트(Artifacts)라는 새로운 기능을 구현했다고 발표했다. 아티팩트는 클로드에게 코드나 텍스트 문서, 웹사이트 디자인 등 콘텐츠를 생성하도록 요청했을 때 답변 내용이 아닌 전용 창에 콘텐츠를 표시하는 기능이다.

안전성과 프라이버시에 관해선 앤트로픽이 영국 인공지능 안전 연구소(UK AISI)에 클로드 3.5 소넷 안전성 평가를 의뢰하고 도입 전에 개선을 거듭했다고 한다. 또 외부 전문가 정책 피드백을 통합해 클로드 3.5 소넷이 다양한 부정 사용에 대처할 수 있다고 강조했다.

클로드 3.5 소넷은 Claude.ai와 클로드 iOS 앱에서 무료로 이용할 수 있다. 유료 플랜인 클로드 프로(Claude Pro)나 팀(Team) 가입자라면 더 높은 속도 제한으로 접근할 수 있다. 또 앤트로픽 API, 아마존 베드록(Amazon Bedrock), 구글 클라우드 버텍스 AI(Vertex AI)에서도 이용할 수 있으며 요금은 입력 토큰 100만 개당 3달러, 출력 토큰 100만 개당 15달러다.

앤트로픽은 앞으로도 클로드 3.5 모델에 대한 지능, 속도, 비용 개선을 계속해 2024년 후반 클로드 3.5 하이쿠(Haiku)와 클로드 3.5 오푸스(Opus)를 출시할 예정이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

이석원 기자

월간 아하PC, HowPC 잡지시대를 거쳐 지디넷, 전자신문인터넷 부장, 컨슈머저널 이버즈 편집장, 테크홀릭 발행인, 벤처스퀘어 편집장 등 온라인 IT 매체에서 '기술시대'를 지켜봐 왔다. 여전히 활력 넘치게 변화하는 이 시장이 궁금하다.

뉴스레터 구독