마이크로소프트가 차세대 AI 추론 가속기 ‘마이아 200(Maia 200)’을 공개했다. 마이아 200은 대규모 AI 토큰 생성의 경제성을 개선하기 위해 설계된 추론 전용 가속기로 애저 환경에서 AI 모델을 보다 빠르고 효율적으로 구동하는 것을 목표로 한다. 마이크로소프트는 칩 설계부터 데이터 센터까지 아우르는 엔드투엔드 통합 구조를 통해 차세대 AI 인프라의 핵심 구성 요소로 마이아 200을 제시했다. 마이아 200은 TSMC의 3나노미터 공정을 기반으로 제작됐다. 1,400억 개 이상의 트랜지스터를 집적했으며 초당 7TB 대역폭을 제공하는 216GB HBM3e 메모리 시스템과 네이티브 FP8·FP4 텐서 코어를 결합해 대규모 모델 추론에 최적화된 구조를 갖췄다. 데이터 이동 엔진과 메모리 하위 시스템을 전면 재설계해 토큰 처리 병목을 줄이고 추론 효율을 높인 점도 특징이다. 성능 지표에서도 기존 가속기 대비 우위를 강조했다. 마이아 200은 FP4 기준으로 3세대 아마존 트레이니움 대비 3배 높은 처리량을 기록했으며 FP8 기준에서도 구글 7세대 TPU를 상회하는 성능을 보였다. 마이크로소프트는 이를 통해 자사 최신 세대 하드웨어 대비 달러당 성능을 30
뤼튼테크놀로지스(이하 뤼튼)가 퓨리오사AI와 전략적 업무협약(MOU)을 체결하고, ‘전 국민 AI 역량 강화’와 고성능 AI 추론 인프라 구축에 공동 대응한다. 양사는 AI 기술의 실용적 보급이라는 공통 목표 아래, AI 대중화와 국가 AI 경쟁력 제고를 위한 협력에 본격 착수한다. 이번 협약은 국내 AI 인프라와 서비스 분야에서 각각 빠르게 성장 중인 두 기업의 맞손이라는 점에서 의미가 깊다. 퓨리오사는 최근 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 LG AI연구원 ‘엑사원’에 공급하며, 엔비디아의 대안으로서 입지를 넓히고 있다. 뤼튼은 월간 이용자 수 500만 명 이상을 확보한 국내 대표 생성형 AI 서비스 플랫폼으로, 지난 3월에는 1080억 원 규모의 시리즈B 투자 유치도 마무리했다. 협약에 따라 뤼튼은 퓨리오사의 레니게이드 기반 추론 인프라를 서비스 환경에 도입해, 대규모 사용자에게 안정적이고 고성능의 AI 서비스를 제공할 계획이다. 퓨리오사는 실사용 기반에서 하드웨어의 성능과 효율성을 입증하며, AI 가속기의 범용성과 경쟁력을 높이는 계기로 삼는다. 이를 통해 양사는 AI 인프라와 서비스 전반에서 시너지를 창출하며 국내 AI 생태계의 기
RNGD 기반 인프라 접근 개방 및 Llama 3.1 사전 컴파일 모델 기반 API도 추가 제공 예정 퓨리오사AI가 자체 개발한 2세대 AI 추론 가속기 ‘레니게이드(RNGD)’를 마이크로소프트 애저 마켓플레이스에 공식 등록하며, 글로벌 시장 확대에 본격 시동을 걸었다. 이번 조치는 LLM과 멀티모달 AI 추론 환경에 최적화된 고성능 인프라를 세계 수백만 애저 고객이 즉시 활용할 수 있는 길을 열었다는 점에서 주목된다. 레니게이드는 클라우드 중심 환경은 물론 온프레미스와 하이브리드 인프라에도 유연하게 적용 가능한 데이터센터용 AI 가속기로, 2023년 핫칩스(Hot Chips) 컨퍼런스에서 첫 공개된 이후 글로벌 반도체·AI 업계의 큰 관심을 받아왔다. 특히 수 분 내로 추론용 인프라를 배포할 수 있고, 수요에 따라 유연하게 확장 가능하며, 기존 애저 데이터 및 소프트웨어 스택과의 통합도 원활해 클라우드 기반 AI 모델 운영의 접근성과 효율성을 크게 높인 것이 특징이다. 이번 입점을 통해 퓨리오사AI는 애저 사용자에게 RNGD 기반 인프라 접근을 개방하고, 추후 Llama 3.1 사전 컴파일 모델 기반 API도 추가 제공할 계획이다. 기업 고객들은 이를 통해