엔비디아, 구글 클라우드와 스타트업 생성형 AI 개발 지원

URL복사

엔비디아 인셉션 프로그램과 구글 포 스타트업 클라우드 프로그램 통합 발표

엔비디아가 구글 클라우드와의 협력 하에 전 세계 스타트업의 생성형 AI 애플리케이션과 서비스 개발 가속화를 지원한다고 발표했다.

9일 미국 라스베이거스에서 개최된 ‘구글 클라우드 넥스트 2024’에서 스타트업을 위한 엔비디아 인셉션 프로그램과 구글 포 스타트업 클라우드 프로그램을 통합한다는 양사의 협업 소식이 발표됐다. 이번 협업으로 엔비디아와 구글 클라우드는 클라우드 크레딧, 시장 진출 지원, 그리고 기술 전문 지식에 대한 접촉 기회 확대를 통해 고객에게 빠르게 스타트업의 가치를 제공하도록 지원한다.

1만8000개 이상의 스타트업을 지원하는 엔비디아 인셉션 글로벌 프로그램의 회원은 특히 AI에 중점을 둔 스타트업의 경우, 최대 35만 달러의 구글 클라우드 크레딧을 제공받고 구글 클라우드 인프라 사용 가속화 경로를 확보할 수 있다.

구글 포 스타트업 클라우드 프로그램 멤버는 엔비디아 인셉션에 가입해 기술 전문 지식, 엔비디아 딥 러닝 인스티튜트 과정 크레딧, 엔비디아 하드웨어와 소프트웨어 등을 이용할 수 있다. 또한, 구글 포 스타트업 클라우드 프로그램의 스타트업 회원은 해당 분야에 관심이 있는 벤처 투자 기관에 노출될 기회를 주는 엔비디아 인셉션 캐피탈 커넥트 플랫폼에 참여할 수 있다.

두 프로그램 모두에서 급성장한 신생 소프트웨어 제조업체는 구글 클라우드 마켓플레이스 등록, 공동 마케팅, 제품 개발 가속화 지원을 우선적으로 받는다. 양사의 이번 협력은 다양한 규모의 기업이 생성형 AI 애플리케이션을 개발하는데 드는 비용을 절감하고 장벽을 완화하기 위해 공개된 일련의 발표 중 가장 최근에 이뤄진 것이다. 특히 스타트업은 AI 투자에 대한 높은 비용으로 인해 많은 제약을 받고 있다.

지난 2월, 구글 딥마인드는 최첨단 개방형 모델 제품군 '젬마'를 공개했다. 엔비디아는 최근 구글과 협력해 모든 젬마 전용 엔비디아 AI 플랫폼에 대한 최적화를 실시, 고객 비용 절감과 특정 도메인별 사용 사례 혁신을 가속했다.

젬마는 구글 딥마인드의 가장 뛰어난 모델 제미나이 제작에 사용된 동일한 연구와 기술로 구축됐다. 양사의 긴밀한 협력으로 거대 언어 모델(LLM) 추론 최적화를 위한 오픈소스 라이브러리 엔비디아 텐서RT-LLM을 통해 엔비디아 GPU로 젬마를 실행, 젬마의 성능을 신속히 발전시켰다.

엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼의 일종인 엔비디아 NIM 마이크로서비스는 구글 쿠버네티스 엔진(GKE)과 함께 AI 기반 앱을 개발하고 최적의 AI 모델을 생산 단계에 배포하기 위한 간소화한 경로를 제공한다. 엔비디아 트리톤 추론 서버와 텐서RT-LLM을 포함한 추론 엔진을 기반으로 구축된 NIM은 광범위한 선도적 AI 모델을 지원하고, 확장성 있고 원활한 AI 추론을 제공해 기업의 생성형 AI 배포를 가속한다.

젬마 7B, 리커런트젬마, 코드젬마를 포함한 젬마 모델 제품군은 엔비디아 API 카탈로그에서 사용 가능하며, 사용자는 이를 브라우저에서 사용하거나, API 엔드포인트로 프로토타입을 제작하거나, NIM을 통한 셀프 호스팅을 할 수 있다.

구글 클라우드를 사용하면 GKE와 구글 클라우드 HPC 툴킷으로 플랫폼 전반에 엔비디아 네모 프레임워크를 배포하기 쉬워진다. 이를 통해 개발자는 생성형 AI 모델의 훈련과 제공을 확장하고 자동화하며, 개발 과정에 빠르게 착수하는 맞춤형 청사진을 통해 턴키 환경을 신속히 구축한다.

엔비디아 AI 엔터프라이즈의 일부인 엔비디아 네모는 구글 클라우드 마켓플레이스에서도 이용 가능하다. 이를 통해 고객은 네모 및 기타 프레임워크에 쉽게 액세스해 AI 개발을 가속할 수 있다. 구글 클라우드는 엔비디아 생성형 AI 가속 컴퓨팅의 가용성 확대를 위해 다음 달 A3 메가의 정식 출시를 발표했다. 해당 인스턴스는 엔비디아 H100 텐서 코어 GPU로 구동되는 A3 가상머신(VM) 제품군의 확장으로, A3 VM에서 GPU 대 GPU 네트워크 대역폭이 두 배로 늘었다.

A3에 탑재된 구글 클라우드의 새로운 컨피덴셜 VM에는 컨피덴셜 컴퓨팅에 대한 지원도 포함돼 있어, 고객이 H100 GPU 가속에 액세스하는 동안 코드를 변경하지 않고도 민감 데이터의 기밀성과 무결성을 보호하고 학습과 추론 도중 애플리케이션과 AI 워크로드를 보호한다. 이 GPU 기반 컨피덴셜 VM은 올해 미리 보기로 제공될 예정이다.

엔비디아 블랙웰 플랫폼에 기반한 엔비디아의 최신 GPU는 내년 초에 두 가지 버전, 엔비디아 HGX B200과 엔비디아 GB200 NVL72로 구글 클라우드에 출시될 예정이다. HGX B200은 가장 까다로운 AI, 데이터 분석 그리고 고성능 컴퓨팅 워크로드를 위해 설계됐으며, GB200 NVL72는 차세대, 대규모, 조 단위의 매개변수 모델 학습과 실시간 추론을 위해 설계됐다.

엔비디아 GB200 NVL72는 각각 2개의 엔비디아 블랙웰 GPU와 엔비디아 그레이스 CPU가 결합된 36개의 그레이스 블랙웰 슈퍼칩을 900GB/s의 칩투칩 인터커넥트를 통해 연결한다. 이는 하나의 엔비디아 NV링크 도메인에서 최대 72개의 블랙웰 GPU와 130TB/s의 대역폭을 지원한다. 통신 병목 현상을 극복하고 단일 GPU처럼 작동해 이전 세대 대비 30배 빠른 실시간 LLM 추론과 4배 빠른 트레이닝을 제공한다.

엔비디아 GB200 NVL72는 멀티 노드 랙 스케일 시스템으로, 구글 클라우드의 4세대 고급 액체 냉각 시스템과 결합될 예정이다. 엔비디아는 지난달 생성형 AI의 요구사항에 최적화된 엔터프라이즈 개발자용 AI 플랫폼인 엔비디아 DGX 클라우드를 H100 GPU 기반의 A3 VM에서 사용할 수 있다고 발표했다. GB200 NVL72가 탑재된 DGX 클라우드는 2025년 구글 클라우드에서도 제공될 예정이다.

헬로티 서재창 기자 |

에이디링크, ‘AFM’ 기술로 산업용 엣지 시스템 유연성 강화

에이디링크가 산업 현장에 최적화된 차세대 엣지 AI 플랫폼을 통해 디지털 전환 가속화에 나서고 있다. 에이디링크는 신뢰성 높은 하드웨어와 임베디드 소프트웨어를 통합한 구조로 스마트하고 안정적인 시스템을 빠르게 구현할 수 있도록 지원한다. 신재생에너지·공장 자동화·지능형 교통 등 다양한 산업 분야에서 적용 가능하며 개발 기간 단축과 운영 효율성 향상을 동시에 실현할 수 있다. 에이디링크는 Intel, NVIDIA, Arm 등 글로벌 기술 기업들과 협력해 엣지 플랫폼의 성능과 확장성을 지속적으로 강화하고 있다. 이러한 협업을 통해 이기종 컴퓨팅 기반의 맞춤형 AI 솔루션을 제공하며 CPU·GPU·FPGA·ASIC을 통합한 구조로 복잡한 연산 작업을 효율적으로 처리할 수 있다. 고객은 애플리케이션 요구사항에 최적화된 시스템을 구성하면서도 투자 대비 효과를 극대화할 수 있다. 특히 에이디링크는 독자 기술인 ‘AFM(Adaptive Function Module)’을 도입해 시스템 통합의 유연성을 높였다. I/O 확장, AI 가속 모듈, SSD, 메모리, 무선 통신 등 다양한 하드웨어를 조합해 고객 맞춤형 구성이 가능하며 산업 현장의 요구 변화에도 신속하게 대응할 수

[인더스트리 솔루션 인사이트] 로봇이 된 공장, 소프트웨어가 된 산업

공장이 움직인다. 단순한 자동화를 넘어, 공장 전체가 하나의 거대한 로봇처럼 작동하는 ‘피지컬 AI(Physical AI)’ 시대가 도래했다. 이 가운데, 공장의 하드웨어 중심 운영은 소프트웨어 기반 플랫폼으로 전환되고 있으며, 이 과정에서 맥락을 이해하는 인공지능(AI), 디지털 트윈(Digital Twin), 시뮬레이션 등 기술이 핵심 역할을 한다. 현시점 제조업은 제품 생산을 이상의 가치를 추구하고 있으며, 시스템 자체를 수출하는 산업으로 진화하는 중이다. 이번 특집은 한국과학기술원(KAIST)의 ‘소프트웨어 정의 공장(SDF)’부터 네이버 ‘인공지능(AI) 에이전트’, 다임리서치 시뮬레이션 기술, 유니티 실시간 3차원(3D) 솔루션까지 제조업 혁신의 최전선 기술 방법론을 짚는다. [특집] 로봇이 된 공장, 소프트웨어가 된 산업 [Real-time 3D] 게임 넘어 산업 현장으로…실감나는 상호작용 경험이 ‘산업 DX’ 핵심 [AI Simulation] 제조·물류 현장 ‘물리적 AI’ 시대 도래…AI 시뮬레이션으로 미래를 현실로 [Physical AI] 공장이 하나의 거대한 로봇 된다…KAIST, 피지컬 AI로 제조 혁신 선언 [AI Agent] AI 에

애로우, AI·ML 기반 자동화 워크플로로 진단 정확도 향상하다

애로우 일렉트로닉스(이하 애로우)가 의료 영상 분야에서 인공지능(AI) 활용 방안을 담은 백서를 발표했다. 이번 백서는 MRI, CT, PET 등 대용량 의료 데이터를 기반으로 한 진단 과정에서 나타나는 다양한 과제를 짚고 이를 해결하기 위한 AI·머신러닝(ML) 기반 분석 기술과 고성능 컴퓨팅 인프라 전략을 제시한다. 의료 영상 데이터는 전 세계 의료 데이터의 30% 이상을 차지하며 2025년까지 지속적으로 증가할 것으로 예상된다. 기존 진단 방식은 방사선 전문의의 경험과 수동 해석에 크게 의존했지만 데이터 복잡성과 환자 증가로 인해 한계가 뚜렷하다. 특히 초기 병변은 신호가 약하거나 대비가 낮아 탐지가 어렵고 환자 간 해부학적 다양성이나 영상 기법 차이로 인해 오진 가능성도 크다. AI와 ML은 이러한 제약을 극복할 수 있는 도구로, 다중 모달리티 데이터를 분석해 미묘한 이상을 식별하고 종양 탐지·분류·치료 반응 예측 등 진단 효율성을 높인다. 백서에 따르면 AI 통합은 기존 방사선학 워크플로를 수동 중심에서 데이터 기반 자동화 파이프라인으로 전환한다. 이미지 수집 이후 GPU·AI 가속기를 활용한 병렬 처리와 NVMe SSD 기반 저장 장치, 고대역폭

경전기차(LEV)의 설계 혁신, 모듈형 파워트레인이 이끈다

지속가능한 미래 모빌리티의 핵심, 경전기차(LEV)의 성장세가 눈부시다. 글로벌 전기차 시장이 2024년 1조3280억 달러 규모에 도달하며, 이 중 LEV는 도심 통근 및 개인 이동 수단으로 빠르게 확산되고 있다. 이 전자책은 바로 이러한 흐름 속에서, 모듈형 파워트레인 설계를 중심으로 한 LEV 기술과 전략을 종합적으로 다루고 있다. 애로우 일렉트로닉스는 eBook을 통해 설계자와 제조사, 시스템 통합자들이 직면한 에너지 밀도 최적화, 열관리, 확장성, 규제 대응 등 핵심 과제를 제시하고, 이를 해결하기 위한 트랙션 인버터, HMI, ADAS, TPMS, 온보드 충전기 등 주요 하위 시스템별 설계 인사이트를 제공한다. 특히 Melexis, ST, Infineon, NXP, Analog Devices 등 주요 반도체·센서 업체들의 솔루션이 체계적으로 소개돼, 제품 선택에 실질적인 가이드가 된다. 주목할 점은, AI 기반 예측 유지보수, 디지털 트윈, 배터리 교체 기술 등 LEV의 미래까지 폭넓게 조망한다는 것이다. 단순한 부품 나열을 넘어, 확장 가능하고 유연한 모듈식 설계의 전략적 가치를 강조하며, 고속 충전·스마트 커넥티비티·자율주행 요소까지 아우르는

애로우, 고성능 LEV 인버터 설계로 모빌리티 전환 가속하다

애로우 일렉트로닉스(이하 애로우)가 소형 전기차(LEV: Light Electric Vehicle) 시장을 겨냥한 차세대 트랙션 인버터 참조 설계를 발표했다. 이번 백서는 전기 이륜차, 삼륜차, 마이크로 모빌리티 등 다양한 LEV 플랫폼에 빠르고 유연하게 적용 가능한 전력변환 솔루션을 제시하고 있다. 이번 참조 설계는 48V, 72V, 96V DC 전압 애플리케이션을 지원하며, 3kW에서 최대 15kW까지 전력 확장이 가능한 모듈형 구조로 설계됐다. NXP의 S32K3xx MCU와 Vishay의 하프브리지 MOSFET 기반 전력 모듈을 바탕으로 하드웨어와 임베디드 소프트웨어가 통합된 형태다. IEC61508 표준을 기반으로 한 기능 안전과 내장형 과전류 보호, 실시간 열 모니터링 등의 안정성 기능도 제공한다. 특히 고효율 전력변환을 위한 최적화된 PWM 제어, 최대 1000V 절연, 온도 센서 3개 지원, 회전식 리졸버 및 홀센서 기반 속도 피드백 기능 등 다양한 LEV 환경에 필요한 정밀 제어 기능이 포함됐다. 전원 보드는 최대 80V / 200A의 하프브리지 MOSFET을 통합해 낮은 온저항과 열저항 특성을 갖추고 있으며, 기생 인덕턴스를 최소화한 설계로

최신뉴스