구글 딥마인드가 유전자 변이 유해성을 예측하는 AI인 알파미스센스(AlphaMissense)를 발표했다.
단백질 설계도인 유전자는 DNA 염기 서열에 의해 기술되어 있으며 이 기술에 돌연변이가 생기면 아미노산 서열에도 돌연변이가 생겨 버리기 때문에 발현하는 단백질 기능에도 이상이 생겨 질병 원인이 되어 버린다. 예를 들면 겸상적혈구(Sickle Cell)는 적혈구 형상이 겸상이 되어 버려 산소를 운반하는 능력이 저하되어 빈혈이 빈발하는 병으로 유전자 돌연변이에 의해 저결구 내 단백질인 헤모글로빈 구조에 이상이 생겨 버리는 것으로부터 일어난다.
겸상적혈구증처럼 DNA 염기서열이 변화 혹은 치환하는 것으로 아미노산 서열이 변화해 이상한 단백질이 만들어져 버리는 돌연변이를 미스센스 변이라고 한다. 인간 게놈에서 발생할 수 있는 미스센스 변이는 7,100만 종류에 달한다. 대부분은 건강에 영향을 미치지 않지만 일부는 겸상적혈구증 같은 유전자 질환 요인이다.
알파미스센스는 미스센스 변이를 분석해 질병 원인이 될 가능성을 예측하는 AI 도구다. 알파미스센스는 단백질 구조 계산 AI인 알파폴드를 기반으로 설계되어 있으며 단어 대신 수백만 개 단백질 서열로 학습된 단백질 언어 모델이라는 신경망이 내장되어 있다고 한다.
구글 딥마인드에 따르면 알파미스센스는 7,100만 종류 미스센스 변이 89%를 분류할 수 있다고 한다. 이에 대해 인간 전문가에 의해 악성이나 양성 여부가 확인된 미스센스 변이는 전체 중 불과 0.1%라고 한다. 관련 내용은 이곳에서 확인할 수 있다.