엔비디아가 개발 중인 AI칩 B100과 B200은 지난 3월 발표 당시 2024년 후반에 입수 가능이라고 발표됐다. 하지만 그 후 설계상 결함이 발견되어 제조가 지연되고 있다고 보도됐다. AI칩 제조 지연과 관련해 엔비디아 젠슨황 CEO가 100% 엔비디아가 잘못했다고 인정하고 개선된 AI칩을 준비 중이라고 밝혔다.
B100 및 B200는 새로운 GPU 아키텍처인 블랙웰(Blackwell)이 채택되는 첫 AI칩으로 2024년 3월 기술 콘퍼런스 GTC 2024에서 블랙웰과 함께 발표됐다.
발표 당시 엔비디아는 B100과 B200 출시는 2024년 후반이라고 전했지만 그 후 제조 과정에서 설계상 결함이 발견되어 이런 AI칩 출하가 지연될 것이라고 보도됐다.
보도에 따르면 B100 및 B200에서 GPU 칩렛과 LSI 브릿지, RDL 인터포저, 메인보드 기판 사이에 열팽창 특성 불일치가 있어 그 결과 시스템이 휘어져 고장으로 이어지기 쉬운 상태라고 한다.
출하 지연에 관한 보도가 나온 뒤 일부 매체는 출하 지연은 엔비디아 생산 파트너인 TSMC가 원인이며 엔비디아와 TSMC 사이에 긴장이 고조되고 있다고 전했다.
이런 보도에 대해 황 CEO는 블랙웰을 채택한 칩에는 설계상 결함이 있어 이로 인해 출하가 지연되고 있다며 이는 100% 엔비디아 잘못이라고 말하며 출하 지연은 TSMC가 원인이라는 설을 가짜 뉴스라고 일축했다.
황 CEO에 따르면 설계상 결함을 수정하기 위해 엔비디아는 7종류 칩을 처음부터 재설계하고 동시에 수정된 AI칩 생산을 시작해야 했다고 한다면서 이런 과정에서 TSMC는 블랙웰 채택 칩 제조를 믿을 수 없을 정도 속도로 재개하는 걸 지원해줬다고 말했다.
보도에선 보통 문제 특정, 수정, 재설계한 칩 제작에는 각각 3개월 정도가 소요된다며 엔비디아와 TSMC가 B100 및 B200 문제를 수정하고 재생산을 시작한 속도는 놀라울 정도라고 평가했다. 관련 내용은 이곳에서 확인할 수 있다.