테크레시피

DRAM 발열 문제 해결할 돌파구는?

DRAM(Dynamic Random Access Memory)은 주로 컴퓨터 주기억장치로 사용되는 메모리 일종으로 항상 전력을 소비하는 한편 대용량을 저렴하게 제공할 수 있다는 이점이 있다. 그런데 이런 DRAM이 직면한 발열 문제가 위기 상황에 이르러 PC나 스마트폰 성능에 영향을 주고 있다는 지적이다.

DRAM은 반도체 메모리를 이용한 기억 소자로 칩 중 작은 커패시터에 전하를 축적해 정보를 보유한다. 이 전하는 소자 내부 누설 전류에 의해 서서히 손실되기 때문에 DRAM에선 수십 밀리 정도 주기로 전하를 보충하는 기억 유지 동작, 리프레시가 필요하다. 리프레시를 위해 전력을 상시 소비하는 대신 대용량을 저렴하게 제공할 수 있다는 게 DRAM의 강점이다. 현재 DRAM은 폭넓은 고성능 기기에 이용되고 있다. DDR5, LPDDR5 ,GDDR6, HBM 등 다양한 DRAM 인터페이스가 등장하고 있지만 이들은 모두 기본 구조가 같고 뜨거워지면 전하가 손실되기 쉬워져 성능이 저하된다는 단점도 공통점으로 지니고 있다.

미국 반도체 기술 기업 난테로(Nantero) 주요 시스템 아키텍트인 빌 지바시(Bill Gervasi)는 보통 DRAM은 0도에서 85도까지는 정상 동작하지만 85도를 넘으면 성능에 지장이 나기 시작해 95도를 초과하면 데이터가 손실되기 시작하는 경향이 있다고 지적한다. 또 이 수치는 최신 14nm 제조공정을 기반으로 하기 때문에 10nm나 7nm, 5nm 혹은 3nm로 스케일 다운을 하면 무슨 일이 일어날까 반문한다.

DRAM은 온도 상승에 따라 전하가 손실되기 쉬워지면 리프레시 빈도를 높여 대응한다. 그런데 반도체 개발용 소프트웨어 기업 관계자는 기기 온도가 상승하고 커패시터에서 전하가 빨리 유출되는 걸 고려해 리프레시 사이클이 더 자주 발생하지만 불행하게도 이 전하 리프레시는 전류를 많이 소비해 DRAM 내부에서 열이 발생한다며 악순환에 빠져버리는 문제를 지적한다.

또 메모리 시스템 1개에선 각각 DRAM이 근접해 DRAM 1개가 열에 의해 고장나도 같은 시스템 내에 있는 다른 DRAM도 고장날 가능성이 높다. 한 램버스 개발자는 견고한 서버용 메모리 시스템이라도 열에 의한 고장으로 DRAM 몇 개가 손실되는 것만으로 시스템 전체가 고장나는 등 메모리 시스템 발열은 큰 문제라고 지적한다.

고장까지가 아니더라도 리프레시 레이트가 높아지면 그만큼 DRAM 대역폭을 빼앗겨 DRAM과 기기 성능이 저하된다. 시스템 성능 중 5%는 이미 기록된 걸 유지하기 위해서만 소비되어 있어 시스템 성능을 희생해야 한다는 지적이다.

이런 문제를 해결하기 위해 반도체 산업계에선 발열 문제를 최소화하고 신뢰도를 높이기 위한 솔루션을 개발하고 있다. 예를 들어 LPDDR이나 DDR5에선 다이에 온도 센서를 내장해 주위 온도에 따라 리프레시 레이트를 조정해 소비전력과 온도 상승을 억제하고 있다. 또 LPDDR이나 DDR5 같은 고밀도 DRAM에선 전하 누설이 발생하면 주위 비트셀을 기초로 데이터를 복원하는 에러 정정 기능을 탑재, 열 문제에 대처하고 있다.

또 히트싱크나 팬 같은 일반 냉각 기술 외에도 칩에 마이크로 유체 채널을 에칭해 칩에 냉각용 액체가 흐르게 하는 기술도 10년 이상 업계로부터 주목받고 있다. 하지만 마이크로 유체 냉각 기술은 실험실에선 기능하는 게 확인됐지만 실장하면 유체에 의한 침식이나 누설 문제를 해결할 필요가 있어 상업적 생산 가능성은 그리 높지 않다.

또 메모리 설계를 근본적으로 재검토해 전하가 새지 않고 전원이 없어도 기억을 유지할 수 있는 NRAM을 개발하기도 한다. NRAM은 탄소나노튜브로 만들어진 비휘발성 메모리로 극단적인 열 조건을 견딜 수 있다. 탄소나노튜브 열전도율은 높고 다른 소재보다 빠르게 열을 확산시킬 수 있기 때문에 칩과 관련한 열 문제를 회피하는데 있어 카본나노튜브가 돌파구가 될 수 있다는 설명이다.

칩이든 부품이든 열을 단순히 나중에 수정할 수 있는 불편 정도로 취급해선 안 되며 열 문제에 대해 더 근본적인 해결이 필요할 수 있다. 소비 전력을 개선하고 열 상황을 개선하려면 많은 시뮬레이션 기술을 채택할 수 있으며 대규모 데이터센터는 냉각을 위해 방대한 전력을 사용하지만 칩 온도 요구 사항이 완화되면 내각에 필요한 전력을 줄일 수 있다. 과거 한 기업이 JEDEC에 동작 온도 시험용을 5도 올리도록 요구했을 때 동작 온도가 5도 올라가면 석탄 화력 발전소 3개 폐쇄에 상당한 정도 소비 전력 삭감으로 이어진다는 결과가 나오기도 했다고 한다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사