원 직경에 대한 원주 길이 비율을 나타내는 원주율 파이(π)는 분자와 분모가 모두 정수인 분수로 나타내지 않는 무리수 일종으로 소수 표기라면 수가 무한으로 계속된다. 이런 원주율 자릿수를 구하는 계산은 슈퍼컴퓨터 벤치마크에 사용되는 등 컴퓨터 연산과는 끊어도 끊어지지 않는 관계다. 구글 클라우드 개발자이자 컴퓨터 과학자인 엠마 하루카 이와오(Emma Haruka Iwao) 박사가 마침내 원주율을 소수점 이하 100조 정도까지 산출했다고 6월 9일 발표했다.
원주율 자릿수는 2016년 22조 4,000억 자릿수까지 산출됐지만 2019년 3월 14일 이와오 연구팀이 31조 4,159억 2,653만 5,897자릿수까지 산출했다. 이 자릿수는 원주율 3.1415926535897…에 따른다.
이후 2020년 1월 29일 컴퓨터 과학자 티모시 마리칸이 50조 자릿수를 산출했고 2021년 8우러 16일 스위스 그라우뷘덴 응용과학대학 연구팀 DAViS(Centre for Data Analytics, Visualisation and Simulation)가 108일 9시간에 걸쳐 62조 8,000억 자리까지 계산했다고 발표했다.
구글 클라우드 연구팀이 원주율 자릿수 산출 세계 기록을 갱신한 건 이번이 2번째다. 연구팀에 따르면 이번 기록 갱신에선 프로그램(y-cruncher) 버전 0.7.8을, 알고리즘에 추드노브스키 공식(Chudnovsky algorithm)을 채택했다고 한다. 추드노브스키 공식은 원주율 계산에서 효율적인 방법으로 알려져 있다.
계산 노드는 구글 클라우드 n2-highmem-128, 운영체제는 데비안 11로 가상 CPU 28 코어와 메모리 864GB를 탑재하고 100Gbps 대역폭을 지원하고 있다. 또 사용 가능한 스토리지 663TB 중 515TB를 계산에 이용해 읽어내는 데이터량은 합계 43.5PB, 기입 데이터량은 합계 38.5PB에 달했다고 한다. 계산 시작은 표준시로 2021녀 10월 14일 4시 45분 44초이며 종료는 2022년 3월 21일 4시 16분 52초로 게산에는 157일 23시간 31분 7.651초가 나왔다.
단일 가상 머신에 연결할 수 있는 영구 디스크 최대 용량은 257TB지만 스토리지는 견적 단계에서 554TB를 이용하는 것으로 밝혀져 있어 연구팀은 계산 노드 1개와 64개 iSCSI 대상을 제공, 32대 스토리지 노드로 이뤄진 클러스터를 설계했다. 클러스터 설정과 관리는 테라폼(Terraform)을 이용해 이전 스냅샷을 삭제하거나 스냅샷에서 재시작하는 등 작업을 수행하는 셸 스크립트를 개발해 2일마다 백업을 자동화했다. 연구팀은 이런 일련의 스트립트를 깃허브에 공개하고 있다.
그 밖에 스토리지나 대역폭 개선을 실시한 결과 원주율 100조 자릿수가 5개월로 산출됐다고 한다. 그런 다음 공식 알고리즘을 이용해 확인한 결과 모든 결과가 일치해 계산이 올바른지 확인했다. 소수점 이하 100조 자릿수까지의 100자릿수는 “465871889512428835564671544483873493812120690481326567191745255431487207545545545545545545545545545545545555555555555555555555555500000”이며 모든 자리는 데모 사이트에서 공개된다.
연구팀은 이런 대규모 계산은 구글 클라우드 내 유연한 인프라를 이용한 대규모 과학기술 계산 예로 이런 대처는 전 세계에서 이뤄지고 있으며 계산 프로그램을 실행하는 5개월 기간 중 가상 머신에 오류가 없었으며 82PB 데이터를 1비트 오류 없이 바르게 읽고 쓸 수 있었기 때문에 이 결과는 구글 클라우드의 안정성을 보여준다고 밝혔다. 또 지난 3년간 구글 클라우드가 쌓아온 인프라와 제품 개선이 이번 프로젝트를 가능하게 했다고 덧붙였다. 관련 내용은 이곳에서 확인할 수 있다.