
구글은 AI 처리 프로세서 TPU를 독자 개발하고 있다. 새롭게 7세대 TPU 아이언우드(Ironwood)가 4월 9일 등장했다.
아이언우드는 MoE(Mixture of Experts)를 채택한 대규모 언어 모델이나 고도의 추론 작업을 실행할 수 있는 추론 모델용으로 최적화되어 있다. MoE 모델이나 추론 모델을 고속 처리하려면 대규모 병렬 처리와 효율적인 메모리 접근이 필요하다. 아이언우드는 대역폭 7.4Tbps인 HBM을 1칩당 192GB 탑재하고 있으며 1칩당 처리 성능은 4614TFLOPS다. 또 포드 하나에 최대 9,216개에 이르는 아이언우드 칩 탑재가 가능하며 1포드당 처리 성능은 42.5EFLOPS에 달한다. 구글은 세계 최대 슈퍼컴퓨터인 엘카피탄(El Capitan) 처리 성능은 1포드당 1.7EFLOPS라며 아이언우드는 엘카피탄과 비교해 24배 이상 성능을 발휘한다고 강조했다.
각 세대 TPU별 1W당 처리 성능을 보면 아이언우드는 트릴리움(Trillium)과 비교해 1W당 처리 성능이 2배로 강화됐다. 각 세대 TPU별 1포드당 성능을 비교하면 아이언우드는 2023년 등장한 TPU v5p보다 10배 이상 성능을 발휘한다. 아이언우드는 2025년 후반 이용 가능할 예정이다. 관련 내용은 이곳에서 확인할 수 있다.
한편 구글은 설계가 완전히 다른 AI 에이전트 간에도 상호운용을 가능하게 하는 프로토콜 A2A(Agent2Agent)를 새롭게 발표했다. A2A는 AI 기업 앤트로픽이 개발한 프로토콜 MCP(Model Context Protocol)를 보완하는 것이라는 위치를 갖는다.
AI 에이전트는 일상적으로 반복되는 작업이나 복잡한 작업을 자율적으로 처리할 수 있는 도구로 기업 고객 지원을 대행하거나 호텔 예약을 하는 등 전문성 높은 행동을 취할 수 있다. 예를 들어 구글은 크롬을 자동 조작할 수 있는 프로젝트 마리너(Project Mariner)라는 AI 에이전트를, 세일즈포스는 고객 관리가 가능한 에이전트포스(Agentforce)라는 AI 에이전트를 설계해 제공하고 있다.
이처럼 각 기업이 독자적인 AI 에이전트를 설계하고 있어서 그대로는 AI 에이전트 간에 정보를 주고받아 원활하게 운용하는 처리가 어렵다. 이를 해결하기 위해 도입되는 게 A2A다.
A2A는 클라이언트 에이전트와 리모트 에이전트 간 커뮤니케이션을 촉진하는 프로토콜이다. A2A를 사용하면 클라이언트 에이전트 그러니까 사용자가 처음에 지시를 내리는 AI 에이전트는 사용자 지시를 올바르게 수행할 수 있는 리모트 에이전트를 찾아내어 정보를 제공하고 리모트 에이전트로부터 얻은 정보를 사용자에게 반환할 수 있게 된다.
리모트 에이전트는 JSON 형식 에이전트 카드를 사용해 자신의 능력을 홍보한다. 예를 들어 자신은 인재 발굴에 최적이라거나 면접 일정 조정에 최적이라는 등이다. 클라이언트 에이전트가 이런 정보를 받으면 사용자 지시에 최적인 리모트 에이전트를 결정하고 서로 메시지를 주고받는 등 정보를 전달한다. 이 과정에서 리모트 에이전트가 영상이나 테이블(표)을 표시할 수 있는데 필요하냐 같이 작업 해결을 위해 서로 협상하기도 한다.
한편 A2A는 AI와 외부 데이터 소스의 연결을 담당하는 프로토콜 MCP를 보완하는 것이라는 위치에 있으며 MCP와 A2A 역할은 다르다. MCP는 AI 에이전트를 외부 도구, API, 리소스에 연결하는 것이며 A2A는 서로 다른 AI 에이전트를 연결하는 것이다.
A2A는 아틀라시안, 세일즈포스, 페이팔 등 50개 이상 회사 지원으로 실현됐다. 오픈 프로토콜로 공개됐으며 2025년 후반에는 정식 버전이 출시될 예정이다. 관련 내용은 이곳에서 확인할 수 있다.
구글은 자사가 제공하는 클라우드 기반 생산성 향상 그룹웨어 스위트인 구글 워크스페이스에 코드 없이 워크플로를 자동화할 수 있는 도구인 워크스페이스 플로우가 추가된다는 내용도 발표했다.
구글 워크스페이스 플로는 구글 워크스페이스에 새롭게 추가된 코드 없는 워크플로 자동화 도구다. 이 기능을 사용하면 프로그래밍 지식이 없어도 G메일이나 구글 드라이브, 캘린더, 스프레드시트, 채팅 등 앱을 조합해 일상 업무를 효율적으로 자동화할 수 있게 된다. 예를 들어 특정 조건으로 이메일을 수신하면 자동으로 드라이브에 파일을 저장하고 이를 팀에 채팅으로 알리는 일련의 흐름을 화면상에서 단계별로 설정해 구현하는 게 가능하다.
또 구글 멀티모달 AI인 제미나이와도 연계되어 있어 자연어로 이런 작업을 자동화하고 싶다고 전달하는 것만으로 AI가 해당 내용을 읽어 최적의 플로우를 제안해주는 기능도 있어 전문 지식이 없어도 직관적으로 업무 개선에 임할 수 있다.

구글 워크스페이스 플로는 사내 승인 프로세스나 알림 업무 등 일상적으로 발생하는 정형 작업을 효율화하는 걸 목적으로 설계됐으며 관리자 뿐 아니라 일반 직원도 활용할 수 있을 것으로 기대된다. 지금은 일부 사용자를 대상으로 프리뷰를 제공 중이며 향후 정식 출시될 예정이다.
또 구글은 2025년 3월 발표한 제미나이 2.5를 구글 클라우드 제품군과 본격적으로 통합하고 기업용으로 활용할 수 있는 환경이 마련됐다며 버텍스 AI 상에서의 제미니 2.5 프로의 퍼블릭 프리뷰 제공 시작, 모델 옵티마이저, 라이브 API, 다지역 대응 등 새로운 버텍스 AI 기능과의 통합 발표, 온프레미스 환경에서의 이용 대응 예정을 발표했다.
또 현재 출시된 제미나이 2.5 프로 외에 더 가벼운 모델인 제미나이 2.5 플래시도 발표됐다. 제미나이 2.5 플래시는 낮은 지연 시간과 비용 효율성을 중시한 모델로 고객 대응이나 실시간 요약과 같은 고빈도 처리에 적합하다. 또 제미나이 2.5 플래시에서는 쿼리 복잡성에 따라 AI의 사고 시간(thinking budget)을 자동으로 조정하는 기능이 탑재되어 있어 사용자가 속도나 정확도, 비용간 균형을 명시적으로 튜닝할 수 있게 됐다. 이런 유연성으로 인해 대량 처리가 필요한 애플리케이션에서도 최적의 성능을 기대할 수 있다는 설명이다.
구글 클라우드 넥스트 2025에서는 구글이 제공하는 AI 코딩 어시스턴트인 제미나이 코드 어시스트에 에이전트 기능이 프리뷰 버전으로 추가된다는 것도 발표됐다. 이 기능을 통해 개발자는 IDE 내에서 외부 서비스와 연계해 태스크 획득이나 설계 문서 요약 등을 수행할 수 있게 된다.
그 중에서도 새롭게 도입된 애플리케이션 개발 환경(ADE)은 구글 클라우드 각종 서비스와 AI 힘을 통합해 인프라를 의식하지 않고 유연하고 빠르게 앱을 개발·배포할 수 있는 공간을 제공한다. 또 듀엣AI(Duet AI) 개발 지원 기능은 제미나이로 통일되어 더 강력한 멀티모달 AI로 코드 뿐 아니라 인프라 구성이나 문서 생성 등에도 대응 가능하게 됐다.
구글 클라우드는 온라인 커뮤니티인 레딧과 협력해 레딧 신기능인 레딧 앤서스 일부에 생성 AI 기술을 제공하는 것도 발표했다. 레딧은 구글 제미나이를 활용해 사용자가 게시한 질문에 대해 관련 스레드나 댓글 요약을 제공할 수 있게 되어 사용자는 방대한 게시물 중에서 원하는 정보를 빠르게 얻을 수 있게 된다. 이런 협력 관계는 2024년 2월 체결된 레딧과 구글 간 연간 6,000만 달러 계약에 기반하며 레딧은 구글의 버텍스 AI를 이용해 검색 결과 향상을 도모하고 있다. 관련 내용은 이곳에서 확인할 수 있다.