머신러닝은 인공지능과 이미지 인식 기술 등 다방면으로 활용되고 있다. 그런데 최근 미국에선 머신러닝을 활용해 금속 유리 합성 패턴을 이전보다 무려 200배나 빠르게 찾아내는 데 성공했다고 한다.
금속유리(액체유리. metallic glasses)는 원소 배열에 규칙성이 없는 비정질 금속 중에서도 유리 전이를 일으키는 물질. 높은 내식성과 내마모성을 갖추고 있어 강철보다 강성이 높고 가벼운 소재 실현이 기대되는 차세대 재료 중 하나다. 하지만 금속유리는 생성 방법 발견 이후 50년간 조합이 한정되어 있는 탓에 실용화에 난항을 겪어왔다. 이런 금속 조합은 수백만 개에 이르는 배합이 있어 엄청난 후보군을 대상으로 모두 실험을 하는 건 쉽지 않은 일이다.
그런데 노스웨스턴대학과 스탠퍼드 선형 가속기 센터, NIST가 금속 유리 생산을 위해 머신러닝을 도입, 샘플 자료 수백 개를 빠르게 만들고 심사하는 데 성공한 데 이어 이를 통해 새로운 금속유리 3가지를 발견했다고 사이언스어드밴스(Science Advances)에 발표한 연구 논문을 통해 보고했다.
머신러닝을 생산 예측에 활용한 예는 이전에도 있었다. 하지만 이번 발표는 측정 결과를 통해 빠르게 예측, 결과를 다음 머신러닝 과정이나 실험에 반영했다는 점에서 차이가 있다. 먼저 머신러닝 알고리즘을 이용해 50년간 수집한 금속유리 생성 실험 데이터 6,000건을 가져왔다. 이를 통해 학습한 이후 2가지 방법으로 샘플 합금을 생성하고 이 합금을 엑스선 검사를 한다. 이 결과를 모은 데이터베이스를 대상으로 머신러닝을 실시, 다른 샘플을 합성하는 과정에 활용한다. 이 과정을 거치면서 이전에는 300∼400여 개 자료를 통해 금속 유리 1개를 발견할 비율을 2∼3개당 금속 유리 1개 꼴로 발견할 수 있게 됐다고 한다. 머신러닝을 도입해 금속 유리를 발견하는 데 필요한 속도를 기존보다 200배 빠르게 증가시켰다는 얘기다.
이번 실험에 이용한 머신러닝 알고리즘은 기존 이론을 이해할 필요가 없다는 점에서 다른 연구에도 응용할 수 있다는 장점이 있다고 한다. 기존에는 인간이 해야 했던 비창조적 실험 과정에서 인간을 해방시켜 인간은 직관과 창의력을 요구하는 다른 작업에 집중할 수 있게 할 수 있다.
머신러닝은 이런 분야 외에도 의료 분야에서도 활용도가 기대되고 있다. 지난해 MIT 연구팀은 의료 분야에 머신러닝을 적용하려는 시도를 하기도 했다. 지난 2014년 유방암 진단을 받은 MIT 레지나 바질레이(Regina Barzilay) 교수는 자신의 질병 치료 관련 정보를 찾으려다 의료 분야에 정보가 부족하다는 점을 알게 됐다. 의사는 환자를 진찰해 얻은 정보를 수기로 적고 기초 통계 분석을 바탕으로 상관관계를 조사한다. 하지만 이런 과정은 컴퓨터 사이언스 쪽에선 봐선 원시적이라고도 할 수 있다.
미국 내에서만 매년 170만 명이 암 진단을 받는다. 임상 시험에 등록된 비중은 전체 중 3%에 불과하다. 현재 의학 연구는 이를 통해 확보한 데이터에만 의존하는 상태인 것이다. 암 치료를 위해선 나머지 97% 환자 치료 관련 정보를 분석할 필요가 있다는 것.
바질레이 교수는 의료 데이터에 머신러닝을 접목, 암 치료 관련 학습에 나섰다. 연구팀은 암 치료 병리 보고서 10만 8,000건에 자연어 처리 도구를 이용해 임상 정보를 추출, DB를 만들었다. 데이터베이스 정확도는 98%로 상당히 높아 사람의 힘으로는 할 수 없는 엄청난 양의 작업을 효율적으로 처리해냈다고 한다. 이렇게 데이터베이스화한 정보는 머신러닝을 통해 추론 가능한 모델로 만들려는 시도를 하는 것이다. 그 뿐 아니라 머신러닝을 통해 예방 의학에 응용하는 것도 시도 중이다. 눈으로 해독하기 어려운 정보가 많은 정보에 딥러닝 기술을 접목해 유방암으로 이어질 만한 징후를 찾아내는 것이다. 의사의 눈으로 확인할 수 없는 초기 유방암 환자를 발견하고 암 재발이 쉬운 환자를 예측하는 데에도 도움이 될 것으로 기대하고 있다. 데이터와 머신러닝을 통한 데이터 분석 기술을 의사에게 제공하면 의료를 발전시키고 더 많은 환자가 혜택을 볼 것으로 기대하고 있다.
실제로 지난 2016년에도 구글 연구팀이 머신러닝을 통해 당뇨병에서 비롯된 안 질환을 조기 발견하는 데 전문의를 웃도는 성과를 보였다는 내용이 발표되기도 했다. 당뇨병 합병증으로 생기는 당뇨병성 망막증은 성인 실명 원인 1위이기도 하다. 방치하면 실명 위험이 있지만 조기 발견을 하면 치료할 수 있다. 실명을 피하려면 가능하면 빨리 질병을 찾아내는 게 중요하다.
물론 안과 전문의는 망막 상태를 보고 당뇨병성 망막증 발병을 감지할 수 있지만 전문의 수가 충분하지 않은 게 문제다. 구글 연구팀은 미국 내 안과 의사 54명과 협력, 망막 이미지 12만 8,000장을 이용해 딥러닝을 통해 당뇨병성 망막증 감지를 시도했다. 그 결과 딥러닝을 통해 9,963명을 대상으로 조사한 결과 구글 알고리즘은 특이성과 검출 감도를 조합한 지표 0.95를 기록했다. 이는 안과 의사 평균 점수인 0.91보다 높은 것이다. 물론 이런 발견은 당뇨병성 망막증 발견을 위한 방법일 뿐이다. 다른 방식을 결합하는 등 안과 전문의 임상에 필요한 일이 더 필요하다는 것. 그럼에도 불구하고 머신러닝 기법을 서두에 밝힌 새로운 재료 합성이나 의료 등 다방면에 접목하면 비창조적인 일 상당 부분을 덜어내는 동시에 의료 분야의 경우 의료 혜택을 더 넓히고 환자 조기 발견 등에 도움이 될 수 있다는 점에서 주목할 만하다.