
과학기술 분야 AI 에이전트를 개발하는 비영리단체인 퓨처하우스(FutureHouse)가 화학 작업에 특화된 AI 추론 모델 ether0를 발표했다. ether0는 미스트랄 스몰 3(Mistral-Small-24B-Instruct-2501)을 기반으로 강화학습을 적용한 모델로 분자 관련 질문에 고정밀도 응답을 제공할 수 있다.
오픈AI o3나 클로드 오푸스 4 같은 추론 모델은 화학 관련 질문을 포함한 벤치마크 테스트에서 인간보다 높은 점수를 기록할 수 있다. 하지만 분자를 다루는 실용적인 질문에 응답하는 건 서툴러서 과학적으로 불가능한 분자 구조를 답변으로 제시하는 경우도 있다. 이런 문제를 해결하기 위해 개발된 게 ether0이다.
ether0는 미스트랄AI 제작 추론 모델 Mistral-Small-24B-Instruct-2501을 기반으로 강화학습과 미세조정을 적용한 모델로 분자 관련 질문을 고정밀도로 처리할 수 있다. C27H37N3O4 구조를 출력하게 한 결과 오픈AI o3와 클로드 오푸스4는 잘못된 구조를 출력했지만 ether0는 과학적으로 정확한 구조를 출력할 수 있었다.
ether0를 포함한 여러 AI 모델과 인간에게 화학 관련 문제를 풀게 했을 때의 정답률을 보면 자유서술식 문제에서 ether0가 인간과 다른 AI 모델을 압도하는 성과를 거뒀다. 또 ether0는 질문에 대한 직접적인 답변에 이르기까지의 사고 내용도 출력 가능하며 그 내용은 과학적으로 설득력 있는 것이었다고 한다.
퓨처하우스 CEO인 샘 로드리게스(Sam Rodriques)는 ether0에서 주목할 만한 점으로 특화형 모델에 비해 효율적인 학습이 가능하다는 특징을 꼽았다.
다만 ether0는 어디까지나 프로토타입 모델이며 분자 관련 문제 이외에서는 성능이 떨어진다, 학습 데이터 영향으로 일부 작업에서는 잘못된 답변을 출력한다는 문제가 있다고 한다. 그럼에도 로드리게스 CEO는 이번 연구는 적절한 학습 데이터만 있으면 언어모델이 과학적 과제에서 효율적으로 초인적 성능을 발휘할 수 있다는 걸 보여준 개념 증명이라 할 수 있다고 어필했다. 관련 내용은 이곳에서 확인할 수 있다.