구글 딥마인드가 AI 창약기업 아이소모픽 랩스(Isomorphic Labs)와 협력해 단백질, DNA, RNA, 리간드 등 생명 분자 구조와 상호작용을 극도로 정확하게 예측할 수 있는 AI 모델인 알파폴드 3(AlphaFold 3)를 출시했다.
모든 생명체는 단백질과 DNA 같은 분자로 구성되어 있지만 이런 분자는 단독 기능하는 게 아니라 수백만 가지 조합에 의한 분자간 상호작용을 통해 생명을 이루고 있다. 알파폴드 3은 모든 생명 분자 구조와 상호작용을 예측하는 AI 모델로 단백질과 다른 분자 유형간 상호작용 예측 정확도가 기존 모델보다 50% 향상됐으며 중요한 상호작용 범주에선 100% 정확도 향상을 달성했다고 한다.
알파폴드 3은 2020년 출시된 알파폴드 2를 기반으로 구축됐다. 이전 모델인 알파폴드 2는 단백질 구조 예측에서 근본적인 진전을 이뤘고 말라리아 백신, 암 치료, 효소 설계 같은 분야에서 여러 발견을 도왔다. 새로운 모델인 알파폴드 3은 단백질 뿐 아니라 광범위한 생명 분자를 다룰 수 있게 되어 생물 재생 가능 소재, 회복력 있는 작물 연구에서부터 의약품 설계, 게노믹스 연구에 이르기까지 다양한 분야에서 혁신을 불러일으킬 가능성이 있다. 실제로 알파폴드 3가 일반 감기 원인 중 하나인 코로나바이러스 스파이크 단백질 구조인 7PNM을 예측한 결과를 보면 실제 구조는 회색으로 표시되어 있어 정확히 일치함을 알 수 있다.
분자 입력 목록이 주어지면 알파폴드 3은 결합 3D 구조를 생성하고 분자가 어떻게 결합되는지 추측한다. 알파폴드 3 모델 핵심은 알파폴드 2 딥러닝 아키텍처인 에보포머(Evoformer) 모듈 개선 버전으로 입력을 처리한 뒤 이미지 생성과 유사한 확산 네트워크를 사용해 예측을 구축한다고 한다. 확산 과정에서는 무질서한 원자 상태에서 출발해 많은 단계를 거쳐 정확한 분자 구조로 수렴한다.
DNA 결합 단백질 구조 7R6R 예측 결과를 보면 분홍색으로 표시된 게 DNA 이중 나선이고 파란색이 단백질. 회색으로 표시된 실제 분자 구조는 어려운 실험을 거쳐서야 밝혀졌지만 알파폴드 3 예측 결과는 실제 구조와 거의 완벽하게 일치한다.
알파폴드 3에는 단백질에 결합해 다양한 작용을 일으키는 리간드나 항체 등 의약품에 많이 사용되는 분자를 예측하는 약물 설계 기능이 있다. 알파폴드 3은 약물적 상호작용을 과거 모든 모델을 능가하는 정확도로 예측할 수 있어 생체 분자 구조 예측에서 물리 기반 도구를 넘어선 첫 AI 모델이 됐다.
알파폴드 3가 RNA 변형 단백질 구조 8AW3를 예측한 걸 보면 단백질은 파란색, RNA 가닥은 자주색, 이온 2개는 노란색으로 표시되어 있으며 회색으로 표시된 실제 구조와 일치함을 확인할 수 있다.
알파폴드 3은 새롭게 공개된 연구 도구인 알파폴드 서버를 통해 접근할 수 있으며 비영리 목적으로는 대부분 기능을 무료로 사용할 수 있다. 알파폴드 3 개발에 참여한 아이소모픽 랩스는 이미 제약사와 협력해 알파폴드 3을 사용한 새로운 치료법을 연구 중이라고 한다. 관련 내용은 이곳에서 확인할 수 있다.