테크레시피

오픈AI, 이미지 인식 GPT-4 터보 위드 비전 일반 공개

오픈AI가 이미지 처리 기능을 갖춘 멀티모달 AI인 GPT-4 터보 위드 비전(GPT-4 Turbo with Vision) 일반 공개를 시작했다. 모델 페이지를 확인하면 gpt-4-turbo 참조가 gpt-4-turbo-2024-04-09로 바뀌었다.

이번에 일반 공개된 GPT-4 터보 위드 비전은 이전에 프리뷰 버전으로 사용할 수 있었다. 오픈AI 개발자 X 계정은 이 프리뷰 버전 GPT-4 터보 위드 비전을 활용해 만든 애플리케이션을 소개했다. AI 스타트업 코그니션(Cognition)은 데빈(Devin)을 개발했으며 GPT-4 터보 위드 비전을 사용해 다양한 코딩 작업을 수행할 수 있게 됐다.

헬시파이(Healthify)는 GPT-4 터보 위드 비전을 사용해 전 세계 식품 사진 인식을 통해 사용자에게 영양 정보를 제공하는 스냅(Snap)이라는 서비스를 구축했다. tldraw는 무한한 캔버스에 UI 등을 그릴 수 있는 서비스로 GPT-4 터보 위드 비전을 사용해 그린 UI를 자동으로 코드화할 수 있게 됐다.

오픈AI 관계자에 따르면 새로운 버전은 이미지 처리 기능 외에도 수학 등 기존 기능도 크게 개선됐다고 한다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독