모든 생물학적 과정은 단백질을 중심으로 전개되지만 3차원적 입체 구조를 가진 단백질은 실제로 어떤 모양을 갖고 있는지에 대해선 지난 50년간 거의 해명되지 못했다. 단백질 입체 구조를 이해하는 건 질병 치료와 신약 개발, 환경 문제 해결에 있어 돌파구가 될 것이라며 과학자들이 연구해온 단백질접힘(Protein folding) 문제를 구글 산하 인공지능 기업인 딥마인드(DeepMind)가 해결했다고 발표했다.
인간의 몸속에는 수십억 개에 달하는 기계 그러니까 단백질이 있다. 단백질은 혈액을 나르고 눈이 빛을 감지할 수 있도록 해주고 근육을 움직이게 한다. 단백질은 모든 생물의 생물학적 과정에 관여해 각 기능과 역할에 따라 3차원적 입체 구조를 갖고 있다. 하지만 인간은 2억 이상 단백질을 발견하고 이 입체 구조가 특정된 건 소수에 불과하다.
입체인 단백질을 푸는 건 20종류 아미노산 구슬에 실을 통과하는 것과 같다. 아미노산이 서로 간섭해 단백질 입체 구조를 풀기 위해 과학자들은 아미노산에서 어떤 단백질이 입체 구조를 갖고 있는지 예측하려 했다. 지난 수십 년간 과학자가 착수해온 단백질접힘 문제가 그것이다.
이 문제를 해결하기 위해 딥마인드가 개발한 시스템이 알파폴드(AlphaFold)다. 알파폴드는 지금까지 확인된 수십만 단백질 입체 구조 데이터로부터 학습을 실시했다. 알고리즘이 대량 데이터로부터 학습해 아미노산 실에서 단백질 입체 구조를 정밀하게 예측할 수 있게 된 것.
알파폴드 예측은 다양한 분야에서 도움이 될 것으로 보고 있다. 질병 원인 예측과 약물 개발이 빠르게 이뤄질 수 있는 건 물론 플라스틱 분해 효소를 확인하고 플라스틱 오염 문제 해결에 도움이 될 수 있다. 또 대기로부터 온실가스인 이산화탄소를 제거할 수 있는 팁도 줄 수 있다.
한마디로 과학자가 자연을 더 잘 이해하기 위해 단백질접힘 문제 해결이 큰 도움이 될 수 있다는 것이다. 많은 과학자가 단백질접힘 문제 해결이 수십 년 뒤에는 몰라도 적어도 몇 년 안에는 어렵다고 생각했지만 딥마인드는 여러 단백질접힘 문제를 실제 실험에 필적하는 정밀도고 해결했다고 밝히고 있다.
단백질접힘 문제는 2년에 한 번 국제단백질구조예측경연대회 CASP가 실시해 과학자가 고안한 구조 예측 평가를 하고 있다. 2020년 CASP 일환으로 딥마인드 기술을 평가한 결과 다른 컴퓨터 프로그램을 웃돌았을 뿐 아니라 귀찮고 번거로운 기존 방식보다 높은 정확도를 기록했다. 기본 방식 예측은 100점 만점에 90점 평가지만 알파폴드 점수 평균은 92.5점을 기록한 것.
단백질접힘 문제 해결은 신약 개발에 큰 도움이 될 것으로 보이지만 기술 확립 시기가 늦어 코로나19 유행성에 큰 영향을 미칠 것으로는 볼 수 없다. 반면 미래에 발생할 수 있는 다음 시기 전염병이나 알츠하이머병 등 유전 질환 이해에 도움이 된다고 보고 있다. 또 단백질 입체 구조를 이해하는 알파폴드 기술은 과학자가 질병을 파악하고 신약을 개발하기 위한 긴 과정 중 극히 일부에만 영향을 미친다는 의견도 있다. 딥마인드가 기술을 어떻게 연구자와 공유할 것인지 불분명한 것도 앞으로 과학에 미치는 영향은 아직 뚜렷하지 않다는 것이다.
딥마인드는 지금까지 바둑 AI인 알파고를 개발한 바 있으며 다른 연구소나 기업에 직접 제품을 판매하는 건 생각하지 않고 있다. 딥마인드 CEO인 데미스 하사비스는 알파폴드 기술에 대한 세부 사항을 발표할 예정이라고 한다. 하지만 발표는 2021년이 될 전망이며 하사비스는 다른 과학자와 기술을 공유할 방법을 모색하고 있다고 언급하기도 했다. 관련 내용은 이곳에서 확인할 수 있다.