퓨리오사AI가 글로벌 무대에서 다시 한번 기술력을 입증했다. 12일 열린 오픈AI 코리아 개소식 행사에서 퓨리오사AI는 자사 2세대 반도체 ‘RNGD’로 초거대 언어모델을 구동하는 시연을 진행하며 국내외 업계의 주목을 받았다. 행사에는 국내 AI 업계 관계자 300여 명이 참석해 현장을 가득 메웠다. 시연의 핵심은 오픈AI가 공개한 오픈 소스 기반 파운데이션 모델 ‘gpt-oss 120B’를 단 두 장의 RNGD로 실시간 구동해낸 점이다. gpt-oss 120B는 세계 최고 수준의 오픈 소스 언어모델로, Mixture-of-Experts(MoE) 구조를 적용해 성능과 효율성을 동시에 확보한 것으로 평가받는다. 그동안 초거대 모델 구동에는 막대한 전력과 비용이 소요된다는 한계가 있었지만, 퓨리오사AI는 이를 효율적으로 해결할 수 있음을 실제 시연으로 증명했다. 특히 RNGD의 높은 연산 성능과 전력 효율은 gpt-oss와 같은 대규모 모델을 안정적으로 운영할 수 있도록 지원한다. 이는 AI 인프라 시장에서 가장 큰 과제로 꼽히는 ‘비용과 전력 문제’를 해결할 수 있는 실질적 대안으로 평가된다. 업계 전문가들은 이번 시연을 통해 퓨리오사AI가 글로벌 AI 반도체
아마존웹서비스(AWS)가 OpenAI의 오픈 웨이트 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’를 아마존 베드록과 아마존 세이지메이커 AI를 통해 제공한다고 7일 밝혔다. 이를 통해 AWS 고객은 고성능 AI 모델을 기반으로 생성형 AI 애플리케이션을 보다 빠르고 유연하게 구축할 수 있게 됐다. OpenAI의 새로운 오픈 웨이트 파운데이션 모델 2종은 추론 성능과 효율성을 갖춘 최신 LLM으로, AWS의 글로벌 클라우드 인프라를 통해 수백만 고객에게 제공된다. 특히 gpt-oss-120b는 아마존 베드록에서 실행 시 제미니(Gemini) 대비 10배, 딥시크-R1(DeepSeek-R1) 대비 18배, OpenAI o4 모델 대비 7배 높은 가격 대비 성능을 제공한다고 AWS는 설명했다. 아마존 베드록을 통해 고객은 OpenAI 모델 기반 AI 에이전트를 손쉽게 배포하고, 보안·확장성을 갖춘 프로덕션 환경에서 운영할 수 있다. 보안 장치를 구성해 유해 콘텐츠의 최대 88%를 차단하는 ‘가드레일(Guardrails)’ 기능도 제공된다. 향후 커스텀 모델 임포트, 지식 베이스, 모델 커스터마이제이션 기능도 추가 지원될 예정이다. 아마존 세이지메이커
엔비디아가 오픈AI와 함께 새로운 오픈 웨이트(open-weight) AI 추론 모델 ‘gpt-oss-120b’와 ‘gpt-oss-20b’ 개발에 참여했다. 이번 협력은 전 세계 개발자, 기업, 스타트업, 정부 등이 첨단 AI 기술을 직접 활용할 수 있는 개방형 모델 보급에 속도를 내기 위한 것이다. 오픈AI는 현지 시간 5일 두 모델을 공개하며, 산업과 규모를 불문하고 생성형 AI, 추론형 AI, 피지컬 AI, 헬스케어, 제조 등 다양한 분야에서 활용 가능하다고 밝혔다. gpt-oss 모델은 엔비디아 H100 GPU로 훈련됐으며, 전 세계 수억 개의 쿠다(CUDA) 기반 GPU에서 최적의 추론 성능을 발휘하도록 설계됐다. 모델은 현재 엔비디아 NIM 마이크로서비스 형태로 제공돼 GPU 가속 인프라 어디서든 배포할 수 있다. 데이터 프라이버시와 엔터프라이즈급 보안 기능을 제공하며, 차세대 엔비디아 블랙웰(Blackwell) 플랫폼에 최적화돼 GB200 NVL72 시스템에서 초당 150만 토큰 처리 성능을 구현한다. 젠슨 황 엔비디아 CEO는 “오픈AI는 엔비디아 AI 위에서 혁신을 이뤄왔고, 이번 gpt-oss 모델 공개는 전 세계 개발자들이 오픈소스 기반으