구글 클라우드, 7세대 TPU ‘아이언우드’ 정식 출시...AI 추론 시대 주도

2025.11.07 15:20:21

구서경 기자 etech@hellot.net

 

구글 클라우드가 AI 추론(Inference) 시대를 이끌 핵심 컴퓨팅 솔루션으로 7세대 TPU ‘아이언우드(Ironwood)’를 정식 출시하고 새로운 Arm 기반 ‘액시온(Axion)’ 가상 머신(VM) 프리뷰 버전을 공개했다. 이번 발표는 기업 고객이 AI 학습부터 추론, 일반 워크로드까지 아우르는 통합적 성능과 효율을 확보하도록 지원하는 데 초점을 뒀다.

 

아이언우드는 지난 4월 ‘구글 클라우드 넥스트 2025’에서 프리뷰로 공개된 7세대 TPU로 대규모 모델 학습과 강화학습, 대용량·저지연 AI 추론 등 복잡한 워크로드를 처리하도록 설계됐다. 기존 TPU v5p 대비 최대 10배, TPU v6e 대비 최대 4배 향상된 학습 및 추론 성능을 제공하며 구글 TPU 중 가장 강력한 에너지 효율을 갖췄다.

 

아이언우드는 구글 클라우드의 통합 AI 슈퍼컴퓨팅 시스템 ‘AI 하이퍼컴퓨터(Hypercomputer)’의 핵심 구성 요소로 컴퓨팅·네트워킹·스토리지·소프트웨어를 하나로 통합해 전반적인 처리 속도와 효율성을 극대화한다. 최대 9216개의 칩을 연결한 슈퍼포드(superpod) 구조와 9.6Tb/s 인터커넥트 기술, 1.77페타바이트의 공유 메모리를 통해 데이터 병목 현상을 최소화했다. 또한 광회로 스위칭(OCS) 기술을 통해 네트워크 장애 시 실시간 경로 복구가 가능하며 수십만 개 TPU로 확장할 수 있다.

 

 

구글 클라우드는 동시에 Arm 네오버스(Neoverse) 기반의 맞춤형 CPU ‘액시온’ 제품군을 확장했다. 액시온은 AI 가속기와 함께 범용 워크로드를 처리하는 효율적 백본 역할을 수행하며 마이크로서비스, 데이터 분석, 오픈소스 DB, 웹 서비스 등에서 탁월한 가격 대비 성능을 제공한다. 새로 공개된 N4A 인스턴스는 x86 기반 VM 대비 최대 2배 향상된 성능을 보이며 향후 ‘C4A 메탈’ 베어메탈 인스턴스도 프리뷰 버전으로 제공될 예정이다.

 

구글 클라우드는 아이언우드와 액시온을 포함한 포트폴리오를 통해 고객이 워크로드별 성능과 비용 요구를 모두 충족할 수 있는 유연한 선택지를 제시한다. AI 하이퍼컴퓨터 구조를 기반으로 칩, 모델, 운영체제, 프레임워크를 수직 통합 설계하여 AI 전 주기에서 최적의 성능을 보장한다.

 

또한 구글 쿠버네티스 엔진(GKE)의 클러스터 디렉터(Cluster Director), 오픈소스 LLM 프레임워크 맥스텍스트(MaxText), TPU 지원이 강화된 vLLM 등과 연동해 하드웨어-소프트웨어 최적화를 강화했다. 특히 GKE 추론 게이트웨이를 통해 최초 토큰 생성 시간(TTFT)을 최대 96% 단축하고 서비스 비용을 최대 30% 절감했다.

 

마크 로메이어 구글 클라우드 AI 및 컴퓨팅 인프라 부문 부사장 겸 총괄 매니저는 “에이전트 워크플로와 컴퓨팅 수요의 기하급수적 증가는 오늘날 추론의 시대를 새롭게 정의하고 있다”며 “하드웨어부터 소프트웨어, 관리형 서비스까지 긴밀히 통합된 풀 스택 AI 하이퍼컴퓨터를 통해 고객이 아이언우드와 액시온을 조합해 가장 까다로운 워크로드에도 유연성과 성능을 확보할 수 있을 것”이라고 전했다.

 

헬로티 구서경 기자 |

Copyright ⓒ 첨단 & Hellot.net






검색