테크레시피

딥시크,-R2 모델, 오는 5월 앞당겨 발표한다

지난 1월 추론 모델 DeepSeek-R1을 발표해 큰 주목을 받은 중국 스타트업 딥시크(DeepSeek)는 차세대 모델인 DeepSeek-R2 출시를 당초 예정보다 앞당길 가능성이 있다는 보도가 나왔다. 딥시크는 또 오프피크 시간대에 API 플랫폼 이용료를 최대 75% 할인한다고도 발표했다.

DeepSeek-R1은 MoE(Mixture-of-Experts)와 MLA(Multihead Latent Attention)라는 기술을 활용해 적은 계산 리소스로 고성능을 실현하는 것으로 화제가 됐다.

중국 정부는 딥시크를 지지하고 적어도 13개 지방 정부와 10개 국영 에너지 기업이 딥시크 모델을 채택하고 있다. 마찬가지로 중국 기업인 알리바바 역시 추론 모델 QwQ-32B-Preview나 QwQ-Max-Preview를 개발해 딥시크와 경쟁을 벌이고 있다.

보도에 따르면 딥시크와 알리바바가 치열한 경쟁을 벌이는 가운데 딥시크는 당초 2025년 5월 초에 발표 예정이던 DeepSeek-R2를 앞당겨 발표할 예정이다. DeepSeek-R2는 이전 모델인 DeepSeek-R1과 비교해 코딩 능력이 개선됐을 뿐 아니라 영어 외 언어에서의 추론 능력이 향상됐다고 한다.

또 딥시크는 매일 16시 30분부터 0시 30분까지의 오프피크 시간대 API 플랫폼 이용료를 할인한다고 발표했다. 입력(캐시 히트)은 100만 토큰당 0.035달러, 입력(캐시 미스)은 100만 토큰당 0.135달러, 출력은 100만 토큰당 0.550달러이며 DeepSeek-V3는 50%, DeepSeek-R1는 75% 할인이 적용된다.

더불어 딥시크는 5개 리포지토리를 2025년 3월 초부터 순차적으로 오픈소스화한다고 발표했다. 이런 움직임은 중국 AI 업계 경쟁이 치열해짐에 따라 각 기업이 표준이 되기 위해 앞다퉈 오픈소스화를 검토하고 있는 모습이라 할 수 있다.

보도에선 DeepSeek-R2 출시는 AI에 의한 리더십을 국가 우선 사항으로 자리매김하고 있는 미국 정부에게는 우려 사항이 될 가능성이 있으며 중국 당국이나 기업의 AI 개발에 대한 노력을 더 활성화시킬 수도 있다고 말했다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독