코히어, GPU 2개로 구현하는 생성형 AI 모델 개발

대규모 언어 모델(LLM) 계기가 된 트랜스포머 논문 저자 중 1명인 에이단 고메즈 등이 설립한 AI 기업 코히어(Cohere)가 3월 13일 새로운 모델인 코맨드A(Command A)를 발표했다. 코맨드A는 GPT-4o나 DeepSeek-V3와 동등 이상 성능을 발휘함에도 불구하고 GPU 단 2개만 필요로 하는 높은 효율성이 특징이다.

코히어 측은 코맨드A는 GPT-4o나 DeepSeek-V3 등 주요 독자 모델이나 오픈 웨이트 모델과 비교해 최소한의 하드웨어 비용으로 최대한 성능을 실현한다며 프라이빗 배포의 경우 코맨드A는 비즈니스 크리티컬한 에이전트 작업이나 다국어 작업에 뛰어나며 일반적으로 GPU 32개를 필요로 하는 다른 모델과 비교해 GPU 단 2개로 배포할 수 있다고 발표했다.

코히어에 따르면 코맨드A는 최대 초당 156 토큰 속도로 토큰을 처리할 수 있으며 이는 GPT-4o 1.75배, DeepSeek-V3 2.4배 속도라고 한다. 그럼에도 불구하고 코맨드A는 A100 또는 H100이 2개만 있으면 작동한다.

It also provides strong performance across a range of standard benchmarks on instruction following, SQL, agentic, and tool tasks. pic.twitter.com/MWa51BKjUM
— cohere (@cohere) March 13, 2025

코맨드A는 비즈니스 사용을 염두에 두고 개발됐으며 업계 평균 2배 크기인 25만 6천(256k) 토큰 컨텍스트창를 갖추고 있다. 이는 한 번에 다수 문서나 최대 600페이지 책을 받아들일 수 있다는 걸 의미한다.

또 세계에서 가장 많이 사용되는 23개 언어로 정확한 응답을 생성할 수 있는 점에서도 두드러진다. 코히어 개발자 문서에 따르면 코맨드A는 영어, 프랑스어, 스페인어, 이탈리아어, 독일어, 포르투갈어, 일본어, 한국어, 중국어, 아랍어, 러시아어, 폴란드어, 터키어, 베트남어, 네덜란드어, 체코어, 인도네시아어, 우크라이나어, 루마니아어, 그리스어, 힌디어, 히브리어, 페르시아어에서 뛰어난 성능을 발휘하도록 훈련됐다고 한다.

코히어 공동 설립자이자 에이단 고메즈와 마찬가지로 구글 브레인 전 연구원인 닉 프로스트는 이 모델을 사람들의 업무 능력을 향상시키기 위해서만 훈련시켰다며 따라서 마치 마음의 메카에 탑승하는 것과 같은 사용감이 될 것이라고 말했다. 관련 내용은 이곳에서 확인할 수 있다.