구글 딥마인드가 2018년 개발한 아미노산 서열 정보로부터 단백질의 3차원 구조를 예측하는 AI인 알파폴드(AlphaFold)는 많은 중요 분야 연구를 가속화하기 위해 2021년 오픈소스로 공개됐다. 지난 5월에는 더 많은 생체분자 구조와 상호작용을 예측할 수 있는 AI 모델인 알파폴드 3을 출시했으며 처음에는 완전한 모델을 공개하지 않았지만 이전 모델에 이어 알파폴드 3도 오픈소스로 공개했다.
단백질은 근육 수축, 혈액 운반, 빛 감지, 음식의 에너지 전환 등 거의 모든 생물학적 과정과 관련된 물질이지만 인류가 발견한 2억 개 이상 단백질 대부분은 아미노산 서열만 밝혀져 있을 정도로 복잡한 구조를 갖고 있다. 아미노산 서열로부터 3차원 구조를 추측하는 건 단백질 폴딩 문제라고 불리며 오랫동안 생물학에선 큰 과제였다. 기존에는 시간과 비용이 많이 드는 단백질 구조 분석을 AI로 크게 개선한 게 구글 딥마인드 알파폴드다.
2018년 알파폴드가 출시된 뒤 2020년에는 단백질 구조 예측에서 근본적인 진전을 이룬 알파폴드 2가 출시됐다. 이어 2024년 5월 발표된 알파폴드 3는 단백질 뿐 아니라 광범위한 생체분자를 다룰 수 있게 되어 재생 가능 물질과 회복력 있는 작물 연구부터 의약품 설계와 유전체학 연구까지 폭넓은 분야에서 과학적 혁신을 촉진할 것으로 기대된다.
지난 11월 11일 구글 딥마인드는 알파폴드 3를 이전 모델에 이어 오픈소스로 공개했다. 알파폴드 3 소프트웨어 코드는 깃허브에 공개되어 누구나 다운로드해 사용할 수 있다.
구글 딥마인드 창립자인 데미스 하사비스와 함께 2024년도 노벨 화학상을 수상한 시니어 리서치 연구원 존 M. 점퍼는 알파폴드 3 오픈소스 공개에 대해 사람들이 이것으로 뭘 할지 보는 게 기대된다고 말했다. 또 구글 딥마인드 컴퓨터 과학자인 푸시미트 코리는 엑스에서 알파폴드 3 모델 코드와 가중치가 학술 목적으로 이용 가능해졌다며 자사는 연구 커뮤니티가 생물학 미해결 문제와 새로운 연구 분야에 알파폴드를 어떻게 활용할지 기대하고 있다고 게시했다.
구글 딥마인드는 처음에는 연구 목적 접근을 가능하게 하면서도 상업적 이익을 보호하기 위해 알파폴드 3를 웹서버를 통해서만 이용할 수 있게 했다. 하지만 논문을 게재한 네이처가 정한 공개성과 심사 기준에 위배된다는 점과 코드나 모델의 가중치, 단백질 구조 및 기타 데이터로 소프트웨어를 훈련시켜 얻은 매개변수 없이 알파폴드 3를 공개한 건 구조 분석 재현성을 손상시킨다는 강한 비판을 받았다. 이에 구글 딥마인드는 방침을 전환해 출시 6개월 만에 알파폴드 3 오픈소스 버전을 제공했다.
알파폴드 3는 누구나 깃허브에서 다운로드할 수 있지만 지금은 안정적인 구조 분석에 필요한 훈련 가중치에 접근하려면 학술 기관에 소속된 과학자가 요청해야 한다. 깃허브에는 알파폴드 3 모델 매개변수에 대한 접근을 요청하려면 양식을 제출하라며 접근은 구글 딥마인드 재량으로 허가된다고 명시되어 있다. 관련 내용은 이곳에서 확인할 수 있다.