테크레시피

딥마인드, 단백질 구조 해석 알고리즘 오픈소스로 공개해

구글 산하 인공지능 기업인 딥마인드(DeepMind)가 이전부터 개발을 진행하던 단백질 입체 구조 예측 분석 알고리즘인 알파폴드(AlphaFold)를 오픈소스화하고 무료로 소스 코드를 깃허브에 공개했다고 발표했다. 딥마인드는 알파폴드를 오픈소스화해 사용자는 전례 없는 정밀도로 단백질 입체 구조를 해명할 수 있다고 밝히고 있다.

인체에서 다양한 작용을 하는 단백질 유전자를 구성하는 염기 정보 게놈에서 디코딩한 20종류 아미노산을 결합한 고분자 화합물이다. 하지만 염기 정보에서 알 수 있는 건 어떤 아미노산이 연결되어 있는지 1차적인 서열 정보 뿐이다. 단백질이 체내에서 어떻게 작용하는지 분석하기 위해선 해당 단백질 입체 구조를 알 필요가 있다. 하지만 아미노산 서열 정보만으론 입체 구조를 알 수 없다. 이 단백질 입체 구조를 어떻게 해명할 것인가 하는 문제는 단백질 접힘(protein folding)에 대해 노력을 기울이고 있다.

입체 구조 해명 자체는 이미 진행 중이며 기존에는 핵 자기 공명이나 저온 전자현미경, X선 회절 등으로 단백질 입체 구조를 파악하고 있었지만 아무도 높은 비용이 소요 예산이 많은 연구팀과 의료기관이 아니면 어려운 문제가 있었다. 또 데이터에서 실제 입체 구조를 해명하는데 많은 계산 능력이 요구되며 슈퍼컴퓨터와 폴딩앳홈(Folding@home) 같은 분산 컴퓨팅 연산 분석을 하 필요가 있기 때문에 자금 뿐 아니라 시간 비용도 있다.

딥마인드가 2018년 개발한 알파폴드는 기계학습을 이용해 유전자 서열 정보로부터 단백질 입체 구조를 예측하는 기술이다. 따라서 기존과 같은 비용을 들이지 않고도 단백질 입체 구조를 해명하는 게 가능하다. 사실 단백질 구조 예측 대회에서 알파폴드를 평가하면 다른 컴퓨터 프로그램을 웃도는 정도를 기록한 것으로 보도됐다.

또 2021년 7월 16일 딥마인드 공동 설립자인 데미스 하사비스 CEO는 알파폴드 버전 2.0을 오픈소스화하고 소스 코드를 깃허브에 공개한다고 발표했다. 동시에 학술지 네이처에 알파폴드에 대한 논문이 게재됐다. 알파폴드 오픈소스화에 대해 딥마인드 모기업인 구글 순다르 피차이 CEO는 딥마인드 알파폴드 기술이 오픈소스 코드와 함께 공개된 걸 기쁘게 생각한다며 과학계가 많은 중요한 분야에서 연구를 가속화하기 위한 단계가 될 것이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

추천기사