테크레시피

오픈AI, 고성능 AI 에이전트 간편 제작 도구 발표

오픈AI가 개발자와 기업이 유용하고 신뢰할 수 있는 에이전트를 구축하는 데 도움이 되는 첫 빌딩 블록 세트를 발표했다.

지난 1년간 오픈AI는 고급 추론과 멀티모달 인터랙션, 새로운 안전 기술 등 새로운 모델 기능을 도입해 에이전트 구축에 필요한 복잡한 여러 작업을 처리하는 모델 기반을 만들어왔다. 하지만 이런 기능을 실제 환경에서 사용 가능한 에이전트로 만드는 건 어렵고 많은 경우 충분한 가시성이나 내장된 지원 없이 대규모 프롬프트 반복이나 커스텀 오케스트레이션 로직이 필요하다는 게 고객으로부터 공유됐다. 이런 과제를 해결하기 위해 오픈AI는 에이전트 애플리케이션 개발을 간소화하기 위해 특별히 설계된 새로운 API와 도구 세트를 출시했다.

Responses API는 오픈AI 내장 도구를 활용해 에이전트를 구축하기 위한 새로운 API 프리미티브다. 간단한 채팅 완성과 어시스턴트 API 도구 사용 기능을 결합했으며 Responses API 하나를 호출해 개발자는 여러 도구와 모델 턴을 사용, 복잡한 작업을 해결할 수 있게 된다.

Responses API에서는 GPT-4o 및 GPT-4o-mini를 사용할 때 웹 검색을 이용할 수 있다. 짧은 사실에 대한 LLM 응답 정확도를 측정하는 벤치마크(SimpleQA)에 따르면 웹 검색을 이용한 GPT-o4는 90%, GPT-o4-mini는 88%로, GPT-4.5의 63%보다 높은 수치를 기록했다.

이 웹 검색 도구는 Responses API 프리뷰 버전으로 개발자라면 누구나 이용 가능하다. 또 gpt-4o-search-preview와 gpt-4o-mini-search-preview를 통해 Chat Completions API에서 미세 조정된 모델에 직접 액세스할 수 있다. 가격은 GPT-o4가 1,000쿼리당 30달러, GTP-o4-mini가 1,000쿼리당 25달러다. 또 개선된 파일 검색 도구로 대량 문서에서 관련 정보를 쉽게 검색할 수 있게 됐다. 이 도구는 Responses API에서 이용 가능하며 가격은 1,000쿼리당 2.5달러다. 파일 스토리지는 1일·1GB당 0.1달러이며 첫 1GB는 무료로 이용할 수 있다.

더불어 컴퓨터를 조작할 수 있는 에이전트를 구축하기 위한 컴퓨터 사용 도구도 이용할 수 있게 됐다. 리서치 프리뷰 모델은 멀티모달 에이전트 벤치마크(OSWorld)에서 38.1% 성공률을 보였으며 웹아레나(WebArena)에서 58.1%, 웹보이저(WebVoyager)에서 87%로 각각 높은 점수를 기록했다. 컴퓨터 사용 도구는 Responses API에서 리서치 프리뷰 모델로 더 높은 요금제를 이용하는 티어3부터 티어5 사용자에게 제공된다. 이용 가격은 입력이 100만 토큰당 3달러, 출력이 100만 토큰당 12달러다.

그 밖에 Agents SDK도 제공된다. 오픈AI는 향후 목표에 대해 모든 산업 내 다양한 작업을 지원할 수 있는 에이전트를 구축하기 위한 원활한 플랫폼 경험을 개발자에게 제공하는 것이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

뉴스레터 구독