
오픈AI가 바이오 스타트업인 레트로바이오사이언스(Retro Biosciences)와 협력해 단백질 설계에 사용할 수 있는 AI 모델인 GPT-4b 마이크로(GPT-4b micro)를 개발했다고 발표했다. GPT-4b 마이크로는 GPT-4o를 기반으로 한 모델로 구글 딥마인드(Google DeepMind) 알파폴드(AlphaFold)와 같은 단백질 구조 예측이 아닌 단백질 상호작용을 예측하는 모델이라고 한다.
레트로바이오사이언스는 건강한 인간 수명을 10년 연장한다’는 목표를 내걸고 노화에 따른 질환을 효과적으로 개선하기 위한 치료법을 개발하는 기업으로 오픈AI 샘 알트만 CEO로부터 1억 8,000만 달러 투자를 받아 설립됐다.
이런 레트로바이오사이언스가 연구하고 있는 주제 중 하나가 야마나카 인자다. 야마나카 인자는 iPS 세포 연구로 노벨 생리의학상을 수상한 교토대 야마나카 신야 교수 등이 발견한 유전자 그룹으로 세포 초기화를 유도하는 Oct3/4, Sox2, Klf4, c-Myc이라는 4개로 이뤄져 있다. 이 유전자를 체세포에 도입하면 미분화 상태까지 리셋된 iPS 세포가 유도된다.
하지만 야마나카 인자 중 하나인 c-Myc이라는 유전자는 iPS 세포를 효율적으로 생성하는 역할을 하는 한편 생성된 iPS 세포를 암화시킬 위험이 높다는 문제가 있었다. 이 c-Myc을 빼면 iPS 세포 제작 효율이 나빠지기 때문에 새로운 야마나카 인자를 찾기 위해 전 세계 과학자가 연구하고 있다.
Our Applied AI team at @RetroBio_ + some @OpenAI homies working together for a few month have created GPT4b-micro, a sequence-based model for, among other things, protein design!
— José Luis Ricón Fernández de la Puente (@ArtirKel) January 17, 2025
GPT-4b 마이크로는 야마나카 인자에서 발현되는 단백질 기능을 높이는 단백질을 설계하기 위해 단백질 서열과 상호작용 데이터로 훈련된 모델이다. 실제로 GPT-4b 마이크로가 예비시험에서 제안한 단백질은 iPS 세포 제작 효율을 50배 높였다고 한다.
레트로바이오사이언스 공동설립자인 조 베츠 라크로와는 GPT-4b 마이크로는 인간 주도 연구보다 더 신속하고 우수한 결과를 가져왔다고 말했다. GPT-4b 마이크로는 단백질 아미노산 서열에 대해 대담한 변경도 제안하며 때론 서열 전체 3분의 1을 변경하는 경우도 있었다고 하는데 이는 기존 연구 방법으로는 불가능한 규모 제안이라고 한다.
한편 오픈AI와 레트로바이오사이언스는 GPT-4b 마이크로를 포함한 연구 결과 공개를 약속했지만 공개 시기는 아직 불명확하다. 모델도 널리 이용할 수 있게 되는 건 아니며 현 단계에서는 어디까지나 기능 데모에 그칠 전망이다. 관련 내용은 이곳에서 확인할 수 있다.