구글 딥마인드가 개발 중인 차세대 멀티모달 모델인 제미니(Gemini)는 오픈AI GPT-4에 필적하는 성능을 갖고 있어 2023년 중 릴리스될 것이라고 보도되고 있다. 하지만 보도에 따르면 구글 순다르 피차이 CEO에 의해 릴리스가 내년으로 연기됐다고 한다.
구글 딥마인드가 개발하는 제미니는 구글 딥마인드가 자랑하는 알파고나 알파고 제로 기술, 대규모 언어 모델을 조합한 것으로 구글 검색, 유튜브, 구글 도서, 구글 스칼라 등 구글 서비스에서 얻을 수 있는 방대한 데이터로 학습되고 있어 텍스트나 음성, 이미지, 영상 등 복수 데이터를 취급할 수 있는 차세대 멀티모달 AI다.
구글 챗봇 AI인 바드나 구글 어시스턴트 책임자는 제미니에 대해 예를 들어 자신이 케이크를 구우려고 하면 제미니는 3층 케이크 만드는 방법 순서 그림 3장을 그려준다며 인터넷상 사진이 아니라 텍스트 뿐이 아니며 이미지도 이용해 인간과 대화할 수 있다고 밝히고 있다.
제미니 자체는 2023년 5월 열린 구글 I/O 20223 기조 강연에서 피차이 CEO를 통해 밝혀졌다. 피차이 CEO는 제미니는 도구와 API 통합에 있어 효율적이며 메모리나 계획 등 혁신을 실현하도록 구축되고 있다고 밝혔다.
2023년 11월 피차이 CEO는 가능하면 빨리 제미니를 출시하는데 주력하고 있으며 제미니에서 주요하면서 가장 큰 버전을 완성하는 단계라며 자사가 개발하는 제미니는 여러 면에서 오픈AI GPT-4와 동등하거나 그 이상 기준을 충족하고 있다고 밝혔다.
하지만 피차이 CEO는 12월 초 캘리포니아, 뉴욕, 워싱턴에서 예정했던 발표 이벤트를 연기하라고 지시했다고 한다. 이 이벤트는 정치인이나 정책 입안자를 대상으로 한 것이었지만 피차이 CEO는 AI가 영어 외 쿼리 일부를 확실히 처리할 수 없다는 걸 알게 되어 출시 연기를 결정했다고 한다.
보도에선 제미니 출시는 구글 역사에서 가장 중요한 제품 출시 중 하나가 될 수 있다며 새로운 인터넷을 만들어내 구글이 오픈AI에 대항하거나 상회할 수 있다는 걸 의미한다고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.