오라클(Oracle)과 AMD가 차세대 AI 확장성을 지원하기 위한 전략적 파트너십을 대폭 확대한다. 양사는 라스베가스에서 열린 ‘오라클 AI 월드 2025’에서 AI 컴퓨팅 성능을 극대화하는 AMD 인스팅트(Instinct) MI450 시리즈 GPU 기반 공개형 AI 슈퍼클러스터를 공동 개발한다고 발표했다.
이번 협력은 오라클 클라우드 인프라스트럭처(OCI)의 제타스케일 슈퍼클러스터(Zettascale Supercluster)와 AMD의 차세대 고성능 프로세서 기술을 결합해, 대규모 AI 훈련과 추론을 위한 유연하고 개방적인 클라우드 인프라를 구축하는 것을 목표로 한다. 초기 배포는 2026년 3분기부터 5만 개의 GPU로 시작하며, 2027년 이후 단계적으로 규모를 확대할 예정이다.
이번 슈퍼클러스터에는 AMD 인스팅트 MI450 GPU, 차세대 AMD EPYC(코드명 베니스) CPU, 그리고 AMD 펜산도(Pensando) DPU와 고급 네트워킹 기술이 결합된다. 특히 ‘헬리오스(Helios)’ 랙 설계를 적용해 랙당 72개의 GPU를 액체 냉각 방식으로 구성함으로써, 고밀도 환경에서도 뛰어난 에너지 효율과 성능 밀도를 제공한다.
AI 워크로드를 위한 핵심 기술 혁신도 눈에 띈다. MI450 GPU는 개당 최대 432GB의 HBM4 메모리와 20TB/s 대역폭을 지원해 이전 세대 대비 약 50% 더 큰 규모의 모델을 인메모리(In-Memory) 상태에서 처리할 수 있다. 또한 AMD의 UALoE(Unified Accelerator Link over Ethernet) 기반 네트워킹 기술을 통해 GPU 간 지연 시간을 최소화하고, 800Gbps급 AI-NIC을 탑재해 초고속 분산 훈련 환경을 구현했다.
AMD EPYC CPU는 기밀 컴퓨팅과 내장 보안 기능을 강화해 AI 워크로드의 데이터 보호를 지원하며, 펜산도 DPU 기반의 가속 네트워킹은 데이터센터 내 라인레이트(Line-Rate) 수집과 보안 통신을 동시에 실현한다. 오라클은 이를 통해 고객이 안전하고 효율적인 대규모 AI 학습 인프라를 운영할 수 있도록 지원할 방침이다.
오라클은 이번 협력으로 AMD 인스팅트 MI355X GPU 기반 OCI 컴퓨트(Compute) 셰이프의 정식 출시도 함께 발표했다. 최대 13만 개 GPU까지 확장 가능한 제타스케일 슈퍼클러스터에 적용되며, AI 훈련부터 추론, 생성형 AI 모델 개발까지 폭넓은 워크로드를 지원한다.
마헤쉬 티아가라얀 오라클 OCI 총괄 부사장은 “AI 산업은 이제 속도보다 확장성과 안정성이 핵심 경쟁력”이라며 “AMD와의 긴밀한 협업을 통해 세계에서 가장 강력하고 개방적인 AI 클라우드 인프라를 구축할 것”이라고 말했다.
포레스트 노로드 AMD 데이터센터 부문 부사장은 “오라클과 AMD는 AI·클라우드 혁신을 함께 이끌어온 오랜 파트너”라며 “이번 협력은 AI 학습·추론·배포를 위한 완전한 개방형 인프라 생태계를 현실화하는 중요한 진전”이라고 밝혔다.
한편, 오라클과 AMD는 10년 이상 AI 및 HPC 분야에서 협력해온 글로벌 파트너로, 차세대 GPU·CPU·DPU·네트워킹을 결합한 AI 컴퓨팅 아키텍처를 지속적으로 개발하고 있다. 두 회사는 향후 OCI와 AMD ROCm 오픈소스 소프트웨어 스택을 통합해, 클라우드 상에서 AI 모델을 보다 자유롭게 개발·운영할 수 있는 환경을 구축할 예정이다.
헬로티 김재황 기자 |