과학과 학술 연구 분야에서 AI 보급으로 데이터와 논문 조작 등 우려가 제기되는 한편 AI는 우수 과학자 생산성 향상과 신약 개발 프로세스 가속화 등 많은 혜택도 가져오고 있다. 구글이 2월 19일 제미나이 2.0을 기반으로 한 과학 특화 AI 어시스턴트인 AI 코-사이언티스트(AI co-scientist)를 발표했다.
AI 코-사이언티스트는 과학자와의 협업 도구로 기능하는 걸 목적으로 한 멀티 에이전트 AI 시스템으로 문헌 검색과 요약 같은 기존 용도를 넘어 기존 증거를 바탕으로 특정 연구 분야에 맞는 새로운 지식을 발견하고 연구 실마리가 될 제안과 가설을 제시하는 걸 목표로 만들어졌다.
AI 코-사이언티스트에는 입력 데이터를 처리하거나 인터넷 리소스에 접근해 출력을 개선하는 모델이 여러 개 탑재되어 있으며 도구 내에서는 다양한 에이전트가 서로 경쟁하는 자기 개선 루프가 일어난다. 이는 제미나이 플래시 씽킹(Gemini Flash Thinking)이나 오픈AI o3와 같은 새로운 추론 모델과 유사한 구조다.

생성 AI라는 점은 변함이 없어 완전히 새로운 발상을 만들어내지는 못하지만 기존 데이터를 활용한 추론으로 과학자를 보조할 수 있으며 과학자와 대화할 수 있는 채팅 인터페이스도 갖추고 있다. 다시 말해 AI 코-사이언티스트는 과학에 특화된 브레인스토밍 도구라고 할 수 있다.

멀티 에이전트 시스템으로서 AI 코-사이언티스트는 에이전트가 정답률을 경쟁하는 일로 레이팅을 사용한 일로 자기 평가 메트릭(Elo auto-evaluation metric)으로 자기 개선을 수행하며 구글은 일로 레이팅이 높을수록 어려운 과제를 해결하는 벤치마크에서 정답률이 높아지는 걸 확인했다.

실제로 전문가에게 연구 11건에서 AI 사용성을 신규성(Novelty)과 영향력(Impact)으로 평가받은 결과 AI 코-사이언티스트는 다른 최신 모델보다 두 항목 모두에서 우수했으며 출력도 긍정적으로 평가됐다.
구글은 AI 코-사이언티스트 향후에 대해 자사는 AI 코-사이언티스트 초기 성과에 고무되어 있으며 과학과 생물의학 분야에서의 강점과 한계를 더 폭넓게 평가하는 게 중요하다고 생각한다며 전 세계 연구 기관에 테스트 프로그램 참여를 요청했다. 관련 내용은 이곳에서 확인할 수 있다.