
중국 스타트업인 마누스AI(ManusAI)가 사용자 지시에 따라 다양한 소스에서 정보를 수집하고 상호작용 요소를 포함한 결과를 출력하는 AI 에이전트인 마누스(Manus)를 발표했다. 마누스는 복잡한 현실 세계 작업을 자율적으로 처리할 수 있는 범용 AI 에이전트로 실제 작동하는 모습을 보여주는 데모 로그도 공개됐다.
마누스AI 공동 창업자 겸 수석 과학자인 지이차오(Yichao Ji)에 따르면 마누스는 개념과 실행 격차를 메우는 자율적인 AI 에이전트이며 범용 인공지능(AGI) 일면을 엿볼 수 있는 것이라고 한다.
예를 들어 마누스에는 여러 채용 후보자가 보낸 지원서를 읽고 과거 프로젝트 경험을 바탕으로 정보를 요약하여 강화학습 전문 지식 순으로 순위를 매기는 작업을 수행시킬 수 있다. 마누스가 작업을 수행하는 동안 화면 왼쪽에는 마누스 사고 과정이 표시되고 오른쪽에는 참조하는 파일이나 인터넷상 페이지 등이 표시된다. 또 작업 실행 중 사용자가 마누스를 떠나도 클라우드에서 작업이 계속되며 작업이 완료되면 알림을 보내게 되어 있다고 한다. 또 작업 실행 중에 추가 파일을 업로드하거나 새로운 지시를 내리는 것도 가능하다.
마누스는 작업 결과를 보고서 형태로 출력하며 경우에 따라 보충 자료도 첨부해 준다. 나온 결과를 스프레드시트로 만들게 할 수도 있다. 또 몇 가지 기준에 맞는 뉴욕 물건을 찾는 작업도 수행 가능하다. 마누스는 다양한 기사를 참조하면서 물건을 찾아나간다. 예산에 맞는 물건 검색도 실시한다. 최종적으로 항목별 평가를 포함한 상세한 보고서를 출력한다.
마누스는 메타와 허깅페이스 연구자가 개발한 대규모 언어 모델 벤치마크 GAIA에서 오픈AI 온라인 정보 수집 에이전트인 딥리서치(Deep research)를 능가하는 성능을 발휘했다고 한다.
마누스 데모 버전에서 실행된 몇 가지 작업에 대해서는 로그를 확인할 수 있다. 7일간 일본 여행 계획을 마누스에게 세우게 한 데모 로그를 재생하면 마누스가 일본 여행에 관한 다양한 웹사이트에서 데이터를 수집하고 시기와 예산, 관심 있는 것에 맞춘 여행 계획을 세운다.
한 엑스 사용자(ayako)는 인간이 달에 살게 되어 달에서 새로운 국가를 설립할 경우 법률은 어떻게 있어야 하는지 생각해보고 또 어떤 정치 체제가 적합하냐는 작업을 부여한 데모를 공개하고 있다.
한편 마누스는 발표 직후부터 예상을 초과하는 사용자로부터 주목을 받아 일반 공개된 데모 버전은 서버 용량 부족으로 거의 작동하지 않는다. 현재는 초대 코드를 가진 사용자만 마누스 데모 버전을 이용할 수 있게 되어 있다. 관련 내용은 이곳에서 확인할 수 있다.