테크레시피

네이처가 선정한 ‘과학을 바꾼 컴퓨터 기술 10′

천문학에서 동물학에 이르기까지 위대한 현대 과학적 발견에는 컴퓨터가 필수다. 과학 학술지 네이처(Nature)가 발표한 과학을 변화시킨 컴퓨터 기술 10선에는 어떤 게 있을까.

첫째는 프로그래밍 언어 선구자인 포트란(FORTRAN). 초기 컴퓨터는 결코 사용자 친화적인 게 아니라 펀치카드를 이용해 코드를 수동 입력했다. 코드 작성은 복잡한 프로그래밍 언어에 대한 지식이 필요했지만 1950년대 IBM이 개발한 포트란이 등장하면서 프로그래밍 언어로 작성된 프로그램을 컴퓨터가 실제로 처리할 수 있는 언어로 쉽게 변환할 수 있게 됐다.

둘째는 고속 푸리에 변환. 1805년 카를 프리드리히 가우스가 고안한 고속 푸리에 변환이라는 알고리즘은 시간에 따라 변화하는 복잡한 신호를 고속으로 처리할 수 있게 해준다. 이 알고리즘은 복잡한 전자파 성질을 이해하기 위해 주파수를 함수로 대체 시각화할 필요가 있는 전파 천문학을 비롯한 과학 분야에서 디지털 신호 처리와 이미지 분석 등에 널리 사용되고 있다.

셋째는 생물학적 데이터베이스다. 대규모 게놈과 단백질 데이터 분석, 데이터 저장 시스템은 생물 정보학 선구자인 마거릿 데이호프(Margaret Belle Oakley Dayhoff)의 연구가 발단이다. 1960년대 생물학자들이 단백질 아미노산 서열 분석에 착수했을 때 데이호프 등은 데이터를 펀치카드에 기록, 인코딩해 데이터베이스 검색을 용이하게 했다고 한다. 지금은 1971년 가동을 시작한 단백질 정보 은행과 1982년 가동을 시작한 젠뱅크(GenBank) 등 다양한 분야에서 데이터세트가 사용되고 있다.

넷째는 대기 순환 모형이다. 제2차세계대전 말기 컴퓨터 선구자인 폰 노이만은 탄도 궤도와 무기 설계를 위한 컴퓨터를 사용해 일기예보 개혁에 임했다. 당시까지 날씨는 경험과 감에 의해 예측되고 있었지만 노이만은 날씨 데이터를 대기 모델, 해양 모델 등 일부 모델마다 구축하고 컴퓨터로 분석해 예측 정확도를 높였다.

다음은 BLAS다. 과학 기술상 문제 등을 해결하기 위한 기술인 BLAS(Basic Linear Algebra Subprograms)는 주로 수학적 연산에 사용되는 것으로 1979년 개발됐다. 이 기술은 벡터와 행렬 연산을 표준화해 덧셈 수준으로 완화시켰다고 한다.

다음은 NIH 이미지(NIH Image). 1980년대 미국립보건원 NIH의 뇌 영상 검사실에서 일하던 웨인 라스밴드(Wayne Rasband)는 X선 필름을 컴퓨터에 표시, 분석하는 프로그램을 고안했다. NIH 이미지 프로그램은 맥OS에서만 작동했지만 나중에 NIH에 의해 이미지제이(ImageJ)라는 고급 이미지 처리 시스템으로 발전을 거듭해 현재는 다른 운영체제에서도 사용되고 있다.

다음은 BLAST. 1978년 마거릿 데이호프는 DNA와 단백질 1차 구조 유사성이나 관련성을 파악하기 위한 시스템(Point accepted mutation)을 고안했다. 이는 뒤에 더 고속화 고정밀화되어 진화하면서 BLAST가 되어 당시 유전자 생물학 분야에 혁신을 가져왔다.

다음은 아카이브(arXiv). 1980년대 후반 과학자 연구 내용은 좁은 지역 사회 내에서만 공유되는 게 일반적이었다. 하지만 1991년 로스 알라모스 국립 연구소에서 일하던 물리학자 폴 긴스파그(Paul Ginsparg)는 연구 내용을 널리 공유할 수 있는 새로운 시스템을 고안한다. 이 시스템은 과학 관련 논문과 기사를 등록해 전달하는 것으로 물리학 커뮤니티에 한정되어 있던 모든 학문을 공개, 1998년 아카이브로 이름을 바꿔 발전을 계속한다. 2021년 기준으로 180만 건 논문이 등록되어 있으며 모두 무료로 공개되어 있다.

9번째는 아이파이썬 노트북(IPython Notebook). 프로그래밍 언어 중 하나인 파이썬은 소스 코드 없이 중간 표현을 순서대로 해석하면서 실행하는 인터프리터형이다. 물리학자 페르난도 페레즈(Fernando Pérez )는 한줄씩 실행하는 언어는 과학 연구에 필요한 모듈 탑재와 데이터 시각화 등에 적합하지 않다고 생각하고 자신의 쉘 아이파이썬을 고안했다. 이 쉘은 이후 아이파이썬 노트북으로 이름을 바꾸고 오픈소스화되어 데이터 과학 분야에서 혁명을 일으켰다.

마지막은 알렉스넷(AlexNet). 인공지능은 체계화된 한 가지 규칙을 이용하는 것과 기계학습에 의해 처리를 실시하는 2가지로 대별한다. 토론토대학 대학원생이던 알렉스 크리제브스키(Alex Krizhevsky)와 일리아 서츠키버(Ilya Sutskever)는 2015년 기계학습에 의한 화상 인식 프로그램인 알렉스넷을 개발했다. 또 대량 이미지를 프로그램으로 분류하는 콘테스트인 이미지넷(ImageNet)에선 당시 최고 알고리즘도 25% 오류를 냈지만 알렉스넷은 15% 오류율을 기록하는 데 성공했다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사