그래픽처리장치(GPU) 자원 실질 가동률 추적·시각화 솔루션 ‘아스트라몬(AstraMon)’ 정식 론칭 “고가의 GPU 도입 비용 대비 낮은 가동 효율 개선”...‘고스트 세션’ 감지 및 원인 분석 씨이랩이 대규모 그래픽처리장치(GPU) 자산의 효율성을 금액으로 환산해 도출하는 솔루션 '아스트라몬(AstraMon)'을 국내 시장에 내놨다. 이번 신제품은 고가의 GPU 리소스가 기업 가치 창출에 기여하는 정도를 지표로 증명하는 데 초점을 맞췄다. 이때 핵심은 GPU 유휴 자원에서 발생하는 경제적 손실액을 ‘원 단위’로 시각화한다는 점이다. 사측에 따르면, 그동안 기업 경영진은 GPU 도입에 자본을 투입하면서도, 실질적인 가동 효율을 파악하는 데 어려움을 겪어왔다고 싶었다. 이에 이번 솔루션은 기존 단순 점유율 지표를 비용 개념으로 변환해 제시한다. 이로써 GPU 유휴 자원으로 인해 발생한 비용에 대한 경영 판단을 내릴 수 있도록 돕는다. 아울러 이 솔루션은 실제 연산 작업이 이뤄지지 않으면서 자원만 점유하는 이른바 ‘비활성 세션(Ghost Session)’을 실시간 감지하고 발생 원인을 추적한다. 여기에 자사 GPU 통합 관리(Orchestration) 솔루션
H200 그래픽처리장치(GPU) 서버 등 고성능 연산 인프라 확충 나서 “피지컬 AI 개발 기반 구축” 휴머노이드 로봇, 산업용 로봇, 자율주행로봇(AMR) 등 다종·이기종 로봇 자원을 하나로 빅웨이브로보틱스가 고성능 그래픽처리장치(GPU) 인프라를 전격 확충하고, 이를 기반으로 피지컬 AI(Physical AI) 현장 솔루션 개발·사업화에 나선다. 사측은 이번 투자를 통해 다종·이기종 로봇을 단일 통합 운영체계에 ‘통합 관리(Orchestration)’하는 방향을 구상했다. 이를 통해 휴머노이드 로봇(Humanoid Robot), 산업용 로봇, 자율주행로봇(AMR) 등 다양한 로봇 폼팩터(Form-factor)를 실제 산업 현장에서 활용하는 인프라를 구축한다. 또한 이 같은 인프라 확보로, 인공지능(AI) 추론과 대규모 학습 속도를 높일 방침이다. 개별 로봇 성능보다 서로 다른 시스템을 하나의 흐름으로 조율하는 역량이 피지컬 AI 시대의 핵심 경쟁력이라는 판단에서다. 이 과정에서 최근 H200 GPU 서버 두 대 등 총 16개 GPU 규모의 고성능 연산 인프라를 확보한 것으로 알려졌다. 사측 관계자에 따르면, 산업 현장에서는 휴머노이드 단독 도입보다 기존
중국이 엔비디아의 최신 인공지능 칩인 H200의 첫 수입 물량을 승인해 자국 인공지능 수요와 국내 산업 육성 사이에서 균형을 모색하고 있다. 미국 경제방송 CNBC는 로이터(Reuters)를 인용해, 중국이 엔비디아(Nvidia)의 H200 인공지능 칩 첫 물량 수입을 승인했다고 보도했다. 로이터에 따르면, 이번 결정은 사안에 정통한 두 명의 소식통을 통해 알려졌다. 소식통들은 중국 당국이 수십만 개 규모의 H200 칩 수입을 승인했으며, 이 승인은 이번 주 젠슨 황(Jensen Huang) 엔비디아 최고경영자의 중국 방문 기간에 이뤄졌다고 전했다. 이들은 사안의 민감성을 이유로 익명을 요청했다. 첫 승인 물량은 주로 중국의 주요 인터넷 기업 세 곳에 배정됐으며, 이후 승인 물량을 받기 위한 다른 기업들은 현재 대기열에 있는 상태라고 소식통 중 한 명은 밝혔다. 다만 초기 승인을 받은 기업들의 구체적 명단은 공개하지 않았다. 보도 시점 기준으로 중국의 공업부와 상무부, 그리고 엔비디아는 이번 승인과 관련한 논평 요청에 아직 응답하지 않은 것으로 전해졌다. 헬로티 |
세상의 흐름을 읽는 스마트한 습관 [글로벌NOW] 매주, 세계는 조용히 변화를 시작합니다. 기술이 바꾸는 산업의 얼굴, 정책이 흔드는 공급망 질서, 기업이 선택하는 미래 전략. 세계 곳곳에서 매주 벌어지는 이 크고 작은 변화는 곧 우리 산업의 내일과 맞닿아 있습니다. 글로벌NOW는 매주 주목할 만한 해외 이슈를 한 발 빠르게 짚어주는 심플한 글로벌 브리핑입니다. AI, 제조, 물류, 정책 등 다양한 분야에서 벌어지는 굵직한 사건과 트렌드를 큐레이션해 독자들이 산업의 큰 그림을 한눈에 파악하도록 돕겠습니다. [로보틱스] 中 AI 석학 “체화 AI, 세계 모델 및 안전기준 마련 시급” · 앤드루 야오(Andrew Yao) 칭화대학교 교수, 해석 가능한 체화 AI 모델 구축 촉구 · 정부 주도 AI 경진대회서 데이터 다양성 강화, 통합 프레임워크 등 강조해 · 개방형 벤치마크, 안전기준 공동 대응 제안...중국 상하이, AI 육성 지원책 발표 잇달아 중국 컴퓨터과학 거장으로 평가받는 앤드루 야오(Andrew Yao) 칭화대학교 교수가 물리적 로봇처럼 움직이는 체화 인공지능(Embodied AI) 분야의 핵심 기반이 아직 미흡하다고 지적했다. 그는 상하이에서 열린
노르마가 신약 개발용 양자 AI 알고리즘을 엔비디아 GPU 플랫폼에서 실행해 기존 CPU 대비 최대 73배 빠른 성능을 확인했다. 노르마는 자체 개발한 양자 AI 알고리즘을 엔비디아의 CUDA-Q(쿠다큐) 플랫폼에서 구동해 성능을 검증했으며, 해당 결과는 엔비디아 SNS를 비롯해 해외 언론과 양자 전문 채널에 소개됐다. 쿠다큐는 GPU와 QPU의 통합을 단순화하고 양자-고전 하이브리드 연산을 지원하는 핵심 기술로, 양자 알고리즘의 개발과 실행 속도를 가속화한다. 이번 프로젝트는 강동경희대학교병원과 공동으로 진행 중인 신약 후보 물질 발굴 연구에 쿠다큐를 적용하기 위해 추진됐다. 신약 후보 발굴은 방대한 화학적 탐색 공간을 다뤄야 하는데, 기존 AI 연산 방식에는 한계가 있었다. 이에 노르마 퀀텀AI팀은 QLSTM, QGAN, QCBM 등 다양한 양자 AI 알고리즘을 개발하고, 쿠다큐를 통해 타 시뮬레이터 대비 우수한 연산 성능을 확인했다. 노르마는 엔비디아의 기술 지원을 받아 H200 및 GH200 기반 쿠다큐 환경을 구성해 알고리즘을 테스트했다. 그 결과 CPU 대비 순전파 과정은 약 60.14~73.32배, 역전파 과정은 약 33.69~41.56배 빠른
하반기 중 공공 기관 대상으로 추론 전용 상품의 CSAP 인증 절차 진행 예정 KT클라우드가 GPUaaS에 엔비디아 H200을 적용하며 고성능 AI 인프라를 제공한다고 24일 밝혔다. KT클라우드는 AI 인프라가 필요한 국내 다수의 공공기관과 AI 스타트업을 대상으로 사용량 기반의 탄력적인 GPU 자원 이용이 가능한 GPUaaS(GPU as a Service)를 제공 중이다. 단기간 대용량∙고사양의 GPU 공급이 요구되는 학습 영역에 특화한 ‘AI Train’, 적은 양의 GPU를 끊김 없이 상시 공급해야 하는 추론 영역에 특화한 ‘AI SERV’ 등 엔비디아 기반의 다양한 상품 라인업을 통해 고객 니즈에 신속하게 대응해 왔다. 특히 AI Train은 다수의 공공 및 민간 고객 레퍼런스를 통해 대규모 GPU 노드 클러스터링과 동적할당 제어 기능을 검증받은 바 있다. KT클라우드는 기존 H100 중심으로 운영되던 AI Train 서비스에 H200을 적용해 한층 강화된 성능을 구현한다는 계획이다. 엔비디아 H200은 업그레이드된 호퍼 아키텍처 기반의 최신 GPU 제품으로 AI 및 고성능 컴퓨팅(HPC) 워크로드를 가속화하는 데 중점을 둔 제품이다. 이전 모델인
반도체 산업은 끊임없는 기술 혁신과 변화의 중심에 있다. 반도체에 대한 가치가 점차 높아짐에 따라, 고도의 반도체 기술력이 곧 국가의 경쟁력으로 대변되는 시대다. 이에 기업들은 기술 리더십을 갖추기 위해 치열한 경쟁을 벌이고 있다. 이러한 상황 속에서 최근 두 기업의 엇갈린 행보가 반도체 시장에서 주목받고 있다. 그 주인공은 바로 엔비디아와 인텔이다. 지속적인 연구 개발로 누구도 넘볼 수 없는 기술력을 갖춘 엔비디아와 시장 변화에 능동적으로 대처하지 못해 어려움을 겪는 인텔. 두 기업은 각기 주어진 도전과제와 기회를 어떻게 활용할 것인지에 대해 주목해 보고자 한다. GPU 기술력, 두 기업의 차이를 가르다 엔비디아는 AI 반도체 시장에서의 기술적 우위를 바탕으로 시장을 선도하고 있다. 특히 GPU를 통해 AI 개발에 있어 압도적인 경쟁력을 발휘하고 있다. 엔비디아의 GPU는 복잡한 데이터를 빠르게 처리하고, 정교한 알고리즘을 실행하는 능력 덕분에 AI 연구 및 상업적 응용 분야에서 폭발적인 수요를 창출했다. 엔비디아가 공개한 보고에 따르면, 엔비디아는 지난해 376만 개의 데이터 센터 GPU를 생산해냄으로써 세계 시장에서 98% 이상의 압도적인 점유율을 기록