테크레시피

中 AI 기업이 발표한 오픈AI o1 필적 추론 AI 모델

중국 AI 기업인 딥시크(DeepSeek)는 주어진 새로운 정보를 바탕으로 결론을 도출하는 추론에 특화된 대규모 언어 모델인 딥시크-R1-라이트-프리뷰(DeepSeek-R1-Lite-Preview)를 발표했다. 이 모델은 오픈AI 추론 모델인 o1-프리뷰에 필적하며 경우에 따라 이를 능가하는 성능을 발휘한다고 평가된다.

R1-라이트-프리뷰는 사고의 연쇄(chain of thought)를 통해 추론을 수행하는 모델로 사용자 질의나 입력에 응답하는 과정에서 다양한 사고 과정 흐름을 사용자에게 설명한다. 이를 통해 모델이 뭘 하고 있는지, 왜 그런 결론에 도달했는지를 문서화할 수 있다.

이 모델은 딥시크 챗봇 서비스인 딥시크 챗(DeepSeek Chat)에서 딥 씽크(Deep Think) 기능을 활성화해 이용할 수 있으며 지금은 하루 50개 메시지까지 무료로 이용 가능하다고 알려졌다.

딥시크에 따르면 이 모델은 AIME와 MATH 같은 주요 벤치마크 테스트에서 오픈AI o1-프리뷰와 비슷한 수준의 성능을 보여줬다고 한다.

하지만 아직 독립된 제3자에 의한 성능 분석이나 벤치마크 검증을 위한 완전한 코드가 공개되지 않아 성능이 객관적으로 증명되지는 않은 상태다. 딥시크 측은 앞으로 R1-라이트-프리뷰 오픈소스 버전 및 API를 출시할 계획이라고 밝혔다.

보도에 따르면 이 모델은 시진핑 주석, 톈안먼 광장, 중국의 대만 침공 시 지정학적 의미 등에 관한 질문에 대해 답변을 거부했다고 한다. 예를 들어 시진핑은 누구냐는 질문에 대해서는 중국어로 죄송하다며 자신은 아직 이런 유형 질문에 대해 생각하는 방법을 배우지 못했다고 응답했다.

R1-라이트-프리뷰와 비교된 오픈AI o1-프리뷰는 오픈AI가 코드명 스트로베리(Strawberry)로 개발한 o1 계열 추론 모델 초기 버전이다. 오픈AI는 또 다른 모델인 o1-미니도 출시했으며 이는 챗GPT 서비스에서 사용할 수 있다. 그 중에서도 o1-프리뷰는 뛰어난 성능을 입증했지만 이전 GPT-4o 모델에 비해 6~7배 가까운 비용이 든다는 점이 문제로 지적되고 있다.

보도에선 추론 모델에 대한 관심이 높아지는 이유는 데이터와 계산 능력을 단순히 모델에 투입하면 성능이 지속적으로 향상된다는 기존 스케일링 법칙이 더 이상 확실하지 않다는 의문이 제기되고 있기 때문이라고 지적했다. 실제로 오픈AI, 구글, 앤트로픽 같은 주요 AI 기업 모델 성능이 과거만큼 극적인 향상을 보이지 않는다는 보도가 잇따르고 있다.

과거 AI 모델은 사전 훈련 단계에 모든 능력을 집중하고 더 많은 처리 능력을 투입해 성능을 강화해왔다. 하지만 이런 모델 처리 능력이 한계에 도달하고 있는 반면 AI에 사고 시간을 부여해 성능을 개선하려는 추론 모델의 미래 가능성이 주목받고 있다. 이에 대해 마이크로소프트 사티아 나델라 CEO는 추론 모델을 가리켜 새로운 스케일링 법칙이 등장하고 있다고 언급했다.

보도에선 이 때문에 다양한 기업이 새로운 AI 접근 방식, 아키텍처, 개발 방법론을 개발하기 위해 열을 올리고 있다고 덧붙였다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사