AI 마이크로소프트, 엔드투엔드 설계 적용한 AI 추론 가속기 '마이아 200' 발표
마이크로소프트가 차세대 AI 추론 가속기 ‘마이아 200(Maia 200)’을 공개했다. 마이아 200은 대규모 AI 토큰 생성의 경제성을 개선하기 위해 설계된 추론 전용 가속기로 애저 환경에서 AI 모델을 보다 빠르고 효율적으로 구동하는 것을 목표로 한다. 마이크로소프트는 칩 설계부터 데이터 센터까지 아우르는 엔드투엔드 통합 구조를 통해 차세대 AI 인프라의 핵심 구성 요소로 마이아 200을 제시했다. 마이아 200은 TSMC의 3나노미터 공정을 기반으로 제작됐다. 1,400억 개 이상의 트랜지스터를 집적했으며 초당 7TB 대역폭을 제공하는 216GB HBM3e 메모리 시스템과 네이티브 FP8·FP4 텐서 코어를 결합해 대규모 모델 추론에 최적화된 구조를 갖췄다. 데이터 이동 엔진과 메모리 하위 시스템을 전면 재설계해 토큰 처리 병목을 줄이고 추론 효율을 높인 점도 특징이다. 성능 지표에서도 기존 가속기 대비 우위를 강조했다. 마이아 200은 FP4 기준으로 3세대 아마존 트레이니움 대비 3배 높은 처리량을 기록했으며 FP8 기준에서도 구글 7세대 TPU를 상회하는 성능을 보였다. 마이크로소프트는 이를 통해 자사 최신 세대 하드웨어 대비 달러당 성능을 30