구글이 독일 막스플랑크신경생물학연구소(Max Planck Institute of Neurobiology)와 공동으로 뇌와 신경을 연결 정보를 고해상도로 이미지화하는 기술을 개발했다고 발표했다.
두뇌와 신경 연결을 이미지화하는 연구 분야는 커넥토믹스(Connectomics). 연결체학이라고 한다. 뇌의 시냅스 결합 정보, 신경 연결 정보를 고해상도로 이미지할 수 있다면 건강한 사람과 그렇지 않은 사람의 차이를 한눈에 알 수 있게 될 수 있다. 효과적인 치료를 할 수 있게 될 것으로 기대된다.
구글 측 설명에 따르면 이번에 개발한 기술은 1mm³ 조직을 이미지화해 1,000TB가 넘는 데이터를 생성할 수 있다고 한다. 세밀한 연결 정보 지도를 만들어내는 게 가능하다는 얘기다.
구글과 막스플랑크신경생물학연구소가 발표한 기술은 필기 인식이나 음성 인식에 이용하는 머신러닝 알고리즘 중 하나로 알려진 RNN(Recurrent Neural Networks)을 이용한 것이다. 물론 비슷한 기술은 이미 지난 3월 인텔이 MIT와 공동으로 딥러닝을 이용한 이미지 기술로 발표한 바 있다. 하지만 구글 측에 따르면 당시 인텔이 발표한 기술보다 10배가 넘는 높은 정밀도로 이미지화가 가능하다고 한다. 구글 측은 이 기술을 텐서플로우에 적용한 소스코드를 깃허브에 무료로 공개했다.
구글은 의료 분야에 인공지능 기술을 접목하려는 시도를 꾸준히 진행 중이다. 지난 3월에는 듀크대학 연구팀과 손잡고 인공지능을 활용해 단백질 결정화 실험을 자동화할 수 있는 시스템을 개발하기도 했다. 단백질이 지닌 생체 기능은 분자 구조에 따라 결정된다. 효과적인 신약을 개발하려면 분자 구조 분석이 중요한 것. 단백질 분자 구조를 분석하려면 단백질 결정이 필요한데 단백질 결정화에는 아직 알 수 없는 부분이 많은 게 문제다.
단백질 결정화 실험에선 준비나 과정 대부분은 자동화됐지만 결정화 실험 결과만큼은 아직까지 인간이 현미경으로 직접 확인할 수밖에 없다. 이렇게 되면 인간의 관찰력과 경험에 의존해야 하는 탓에 자칫 결정화를 놓치거나 오인해버릴 수도 있다.
듀크대학은 MARCO(Machine Recognition of Crystallization Outcomes), 결정화 성과물 기계인식을 통해 이 같은 단백질 결정화 결과물을 인공지능으로 자동 인식해 위험을 줄일 수 있다고 보고 50만 개가 넘는 단백질 결정화 실험물 데이터를 구글 측에 협조 요청했다. 구글은 이에 따라 신경망을 통해 결정화 결과물을 자동 분류할 수 있는 시스템을 개발했다.
이를 통해 MARCO가 수집한 방대한 자료를 학습해 인공지능이 단백질 결정을 높은 정밀도로 시각적으로 식별할 수 있게 됐다. 연구팀에 따르면 단백질 결정 식별 정밀도는 인간이 85% 가량인 데 비해 인공지능을 이용하면 95%까지 높아졌다고 한다. 단백질 결정 발견이나 분류를 인공지능이 자동으로 처리하면 단백질 결정화 실험 자체를 거의 자동화할 수 있게 된다. 이를 통해 단백질 구조 분석에 유리해지고 신약 연구 시간이나 비용을 대폭 줄일 수 있을 것으로 기대된다. 구글은 이 모델 역시 깃허브에 공개하고 있다.
신약 쪽은 아니지만 4월에 발표한 것도 비슷한 맥락에서 도움을 줄 수 있다. 인공지능을 통해 광학 현미경 영상을 분석, 실시간으로 암을 검출해내는 기술을 개발한 것이다. 환자가 암에 걸리면 의사는 환자에게서 채취한 신체 조직을 광학 현미경으로 관찰해 암 조직 존재 여부를 판정한다. 구글이 개발한 건 현미경으로 보이는 패턴을 보고 실시간으로 암 조직으로 보이는 부분을 인공지능이 감지하게 해주는 것이다. 의사가 암 진단을 할 때 걸리는 시간이나 피로도를 없애주는 것. 암을 찾으려면 채취한 모든 세포를 조사해야 하고 때론 암 검출이 곤란할 때도 있을 수 있다. 이 같은 문제를 광학 현미경과 인공지능 기술을 결합해 해결한 것이다.
광학 현미경이 보여주는 영상을 인공지능이 감지하고 학습한 대량 패턴과 유사한 조직을 찾아준다. 인공지능은 조직을 찾아 테두리에 표시를 해 의사가 쉽게 판단해볼 수 있게 돕는다. 영상과 감지한 테두리 속 투영된 이미지 사이에 오차가 발생하지 않게 인공지능은 초당 10프레임 속도로 피드백을 주면서 테두리 위치와 영상을 동기화한다. 인공지능이 실시간으로 이 같은 진단 보조를 해주면 암 진단 정확도를 높이고 시간을 줄일 수 있게 될 전망이다. 개발한 알고리즘은 4∼40배 배율로 작동해 주요 암 진단에 활용도를 높일 수 있게 될 것으로 보인다.
구글의 이 같은 시도는 인공지능 알고리즘을 통해 현대 의료에서도 발생하는 의료 낭비를 줄이는 한편 이를 간소화하려는 노력이라고 할 수 있다. 구글은 의료 분야에 진출하기 이전부터 환자 사망 확률을 추정하는 알고리즘도 개발해왔다. 실제로 후기 유방암 환자가 병원에서 방사선 검사를 받고 병원 내 컴퓨터로 분석했을 때 이 환자의 사망 확률은 9.3%로 추정됐지만 구글 알고리즘으로 17만 건이 넘는 데이터를 바탕으로 조사한 결과 사망 위험은 2배가 넘는 19.9% 추정으로 나온 바 있다. 실제로 며칠 뒤 이 환자는 사망했다고 한다.
구글은 환자 사망 확률을 예측할 수 있는 새로운 알고리즘을 지난 5월 발표했다. 데이터를 자동 학습해 성능을 스스로 끌어올릴 수 있고 이를 바탕으로 환자가 병원에 얼마나 오랫동안 머물게 될지, 재입원 가능성은 어느 정도가 될지 여부를 예측한다. 이 알고리즘은 기존 기술보다 훨씬 빠르고 정확하게 환자에게 앞으로 일어날 일을 예측해낸다.
물론 기존 병원에서도 건강 기록이나 여러 환자 데이터 등을 바탕으로 의료 서비스 품질을 개선하려고 노력해왔지만 의료 데이터를 모으고 분석하는 건 상당한 시간과 비용을 요구한다. 이제까지 의료용으로 나온 소프트웨어 자체도 대부분 수작업 코딩을 한 것이다. 이에 비해 구글 알고리즘은 자동으로 데이터 분석 방법을 배우는 접근 방식을 취한다.
구글이 의료 분야에 공을 들이는 건 그러니까 인공지능과 의료를 결합시키려고 하는 건 성공적으로 된다면 구글이 의료 분야에 존재하는 데이터를 독점적으로 활용할 수 있는 능력을 보유할 가능성을 보여주고 있다. 물론 알고리즘을 통해 시간과 비용을 줄여주고 결과적으로 이를 통한 가치 제공을 기대해볼 수 있다. 하지만 의료 데이터의 경우 관련 법규나 규제에서 자유롭기는 쉽지 않다는 점이 걸림돌이라고 할 수 있다(적어도 구글 입장에선). 의료와 인공지능의 결합은 이렇듯 새로운 가치 창출과 새로운 시장에서 발생할 금맥(데이터), 이를 둘러싼 규제의 결합을 어떻게 풀어야 하는지에 대한 숙제를 던져주고 있다.