미래 LLM(대형 언어 모델) 인프라에도 적합한 핵심 빌딩 블록 제공 슈퍼마이크로컴퓨터(이하 슈퍼마이크로)가 생성형 AI의 도입을 가속화하기 위한 슈퍼클러스터 포트폴리오를 발표했다. 최신 솔루션은 현재는 물론 미래의 LLM(대형 언어 모델) 인프라에도 적합한 핵심 빌딩 블록을 제공한다. 슈퍼마이크로의 탁월한 슈퍼클러스터 솔루션 3종은 현재 생성형 AI 워크로드에 사용 가능하다. 4U 수냉식 냉각 시스템 또는 8U 공냉식 냉각 시스템은 강력한 LLM 학습 성능은 물론 대규모 배치(Batch)와 대용량 LLM 추론용으로 특별히 제작 및 설계됐다. 마지막으로 1U 공냉식 슈퍼마이크로 엔비디아 MGXTM 시스템을 갖춘 슈퍼클러스터는 클라우드 규모 추론에 최적화해 있다. 찰스 리앙(Charles Liang) 슈퍼마이크로 사장 겸 CEO는 "AI 시대에 컴퓨팅 단위는 단순히 서버 수가 아닌 클러스터로 측정된다. 슈퍼마이크로는 글로벌 제조량을 월 5000개의 랙으로 확장해 빠르게 완전한 생성형 AI 클러스터를 제공할 수 있다"며, "확장 가능한 클러스터 빌딩 블록에 64노드 클러스터는 400Gb/s 엔비디아 퀀텀-2 인피니밴드 및 스펙트럼-X 이더넷 네트워킹을 갖춰 72
양사는 협력으로 고성능 엣지 AI시장 공략에 나설 계획 사피온은 16일인 오늘 어드밴텍 코리아와 함께 수요연계를 통한 시스템 반도체 시제품 제작지원사업인 ‘콤파스(COMPASS)’ 시제품 제작 지원 대상자로 선정됐다고 밝혔다. 양사는 협력을 통해 고성능 엣지 AI시장 공략에 나선다. 엣지 AI는 서비스가 필요한 장치 혹은 제품에서 인공지능 응용이 직접 구동되는 것을 의미한다. 클라우드 시스템과 비교해 엣지 AI의 기술을 통해 저지연 실시간 서비스 및 개인 정보 보안 강화 등이 가능하다. 콤파스는 산업통상자원부 산하 한국산업기술기획평가원이 운영하고 한국반도체연구조합이 주관하는 수요연계를 통한 시스템반도체시제품 제작지원사업으로서, 시스템 반도체 분야 수요가 있는 기업과 기술을 가진 반도체 공급 기업을 매칭하고, 상용화를 위한 시제품 개발에 필요한 사업비를 지원한다. 사피온은 데이터 센터에 이어 엣지 분야에서도 사업을 확대해갈 계획으로, 어드밴텍과 AI 엣지 컴퓨팅용 서버개발의 속도를 높일 예정이다. 사피온은 AI 반도체를 탑재한 엣지 서버용 카드를 개발하고, 어드밴텍은 사피온의 카드를 탑재한 엣지 서버 개발을 추진한다. 이를 통해 사피온은 AI 반도체의 활용 범
바로에이아이 이용덕 대표 인터뷰 AI는 각 산업 분야에서 혁신을 주도하고 있는 핵심 기술로 각광받고 있다. 이에 수많은 기업 및 관련 기관이 미래의 경쟁력을 확보하기 위해 AI 연구에 힘을 쏟는다. 그러나 이러한 연구에서 가장 큰 난관 중 하나는 바로 AI 개발을 위한 효율적인 인프라 구축이다. 이는 초기 연구 단계에서 부담스러운 과제로 작용한다. 바로에이아이는 이러한 어려움을 극복하기 위해 효율적인 인프라 운용 전략을 제안하는 기업이다. 온프레미스 인프라를 효과적으로 유지 보수하고 관리함으로써 AI 연구에 대한 현실적인 해결책을 제시하고 있다. AI 연구 가속할 동력 제공하다 AI 연구를 진행하기 위한 인프라 구축에는 어려움이 존재한다. 하드웨어 비용 부담, 데이터 보안과 규정 준수의 복잡성, 유지 보수 및 관리에 따른 시간과 노력 등이 그것이다. 특히 AI 연구를 수행하는 초기 과정에서 온프레미스 인프라의 필요성은 여러 측면에서 중요하다. 담당자는 학습 모델을 훈련시키기 위해 온프레미스 인프라에 구축된 하드웨어 자원을 즉시 활용할 수 있어야 한다. 성능과 대역폭 측면에서도 온프레미스 인프라는 매력적인 선택지다. 최근 대용량 데이터를 다루거나 높은 성능이
HBM3e로 초당 4.8테라바이트의 속도로 141GB 메모리 제공 엔비디아가 엔비디아 HGX H200을 출시한다고 밝혔다. 이 플랫폼은 엔비디아 호퍼 아키텍처를 기반으로 고급 메모리가 내장된 엔비디아 H200 텐서 코어 GPU를 탑재하고 있다. 따라서 생성형 AI와 고성능 컴퓨팅 워크로드를 위한 방대한 양의 데이터를 처리한다. 이번 HGX H200 출시로 AI 컴퓨팅 플랫폼을 가속화할 것으로 기대된다. 엔비디아 H200은 HBM3e를 제공하는 최초의 GPU다. HBM3e은 더 빠르고 대용량 메모리로 생성형 AI와 대규모 언어 모델의 가속화를 촉진하는 동시에 HPC 워크로드를 위한 과학 컴퓨팅을 발전시킨다. 엔비디아 H200은 HBM3e를 통해 초당 4.8테라바이트의 속도로 141GB의 메모리를 제공하며, 이전 모델인 엔비디아 A100에 비해 거의 두 배 용량과 2.4배 더 많은 대역폭을 제공한다. 세계 유수 서버 제조업체와 클라우드 서비스 제공업체의 H200 기반 시스템은 2024년 2분기에 출시될 예정이다. 엔비디아 하이퍼스케일과 HPC 담당 부사장인 이안 벅(Ian Buck)은 "생성형 AI와 HPC 애플리케이션으로 인텔리전스를 생성하기 위해서는 대규모의
“인프라 구축 및 운영 비용 최대 40% 절감 효과 가져다줄 것” SK텔레콤(SKT)이 기업 IT 인프라 구축 및 운영 관련 비용 감축이 가능한 ARM 기반 클라우드 인프라(이하 클라우드 어플라이언스) 사업에 집중할 예정이다. 클라우드 어플라이언스는 높은 코어 집적도와 전력 효율성을 지닌 ARM을 토대로 서버에 상용 소프트웨어가 최적화되도록 SKT 가상화 기술을 접목한 제품이다. SKT 관계자에 의하면 해당 기술은 기업이 자체 운영 인프라 환경뿐만 아니라 모든 클라우드 환경에서 활용 가능하다. SKT는 기술 출시를 위해 서버 제조사 한국 HPE로부터 ARM 기반 서버를 공급받은 후 소프트웨어 업체 티맥스소프트의 웹 및 애플리케이션 서버(WEB·WAS) 솔루션을 탑재하는 등 협력관계를 구축했다. 이어 기술 검증을 진행했는데, 검증 결과에 따르면 기존 x86 기반 서버 대비 투자·운영비 등 총 비용이 최대 40%가량 절감된 것으로 나타났다. 더불어 동일 전력 대비 성능은 최대 120%에 달했다. SKT는 이를 통해 랙 하나당 연간 탄소배출량 41.7톤이 감축될 것이라 발표했다. 이는 기업이 탄소절감 인증 실적을 활용할 수 있기 때문에 ESG 경영에도 관여할 것으
발열과 소음을 최적화로 사용 시 공간 제약 없는 수냉각 시스템 개발 바로에이아이가 AI TECH+ 2023에 참가해 자사의 수냉식 멀티 GPU 서버 포세이돈 제품군을 선보였다. 바로에이아이의 '포세이돈'은 높은 성능과 쾌적한 사용성을 갖춘 수냉식 멀티 GPU 서버다. 수냉각 시스템은 발열과 소음을 최적화해 사무실, 연구실 등 공간 제약없이 사용하도록 설계됐다. 이에 포세이돈의 장점 중 하나는 서버실을 따로 두지 않아도 된다는 것이다. 포세이돈 라인업 중 하나인 '알파(Alpha)'는 엔비디아4090 GPU가 장착돼 연구자의 개발 과제에 대해 데이터가 커지기까지 범용적으로 사용하도록 최적화한 GPU 가속 시스템이다. 엔비디아4090 24GB 기반 시스템은 초기 연구자가 손쉽게 접근하고 사용 가능한 시스템으로, 유연한 전환가 확장이 가능하다. '쿼드로(Quadro)'는 엔비디아 6000ada GPU가 장착돼 그래픽스 및 렌더링, 시뮬레이션과 같은 대규모 데이터 셋의 워크플로우 성능을 향상시킨다. 쿼드로는 디자이너, 엔지니어, 과학자 등의 직종에서 필요한 그래픽 컴퓨팅 및 워크플로우를 제공한다. 바로에이아이는 시스템 소프트웨어 및 응용 프로그램에서 멀티 GPU가
애플리케이션에서 손실 최소화하고 신뢰성 및 사용 편의성 높여 인피니언 테크놀로지스(이하 인피니언)는 TOLL(TO leadless) 패키지를 적용한 실리콘 카바이드(SiC) CoolSiC MOSFET 650V 제품군을 출시했다. 새로운 SiC MOSFET은 인피니언의 포괄적인 CoolSiC 포트폴리오를 강화하며, 서버, 텔레콤 인프라, 에너지 저장 시스템, 배터리 포메이션 솔루션 등의 애플리케이션에서 손실을 최소화하고 높은 신뢰성을 달성하며 사용 편의성을 높이도록 설계됐다. CoolSiC 650V 고성능 트렌치 기반 SiC MOSFET은 다양한 애플리케이션을 지원하도록 다양한 구성으로 제공된다. JEDEC 인증 TOLL 패키지의 새로운 제품군은 낮은 기생 인덕턴스를 특징으로 해 높은 스위칭 주파수, 낮은 스위칭 손실, 우수한 열 관리 및 자동 어셈블리를 가능하게 한다. 컴팩트한 폼팩터로 보드 공간을 효과적으로 사용할 수 있어 시스템 디자이너는 우수한 전력 밀도를 달성한다. 650V CoolSiC MOSFET은 가혹한 환경에서 신뢰성을 자랑하므로, 반복적으로 하드 정류를 하는 토폴로지에 적합하다. 내장된 .XT 인터커넥트 기술은 열 저항과 열 임피던스를 낮춤으
산업용 디바이스 서버 ‘SG-1161RIL/ALL’ 및 아이솔레이션 컨버터 ‘CS-428i V2.0’ 출시 시스템베이스가 디바이스 서버 SG-1161RIL/ALL과 아이솔레이션 컨버터 CS-428i V2.0을 출시했다고 밝혔다. SG-1161RIL/ALL은 이더넷 네트워크를 통해 RJ45형 시리얼 포트 활용이 가능한 16포트 디바이스 서버다. 시리얼 통신 최고 속도 921.6Kbps를 발휘하며, RS232·422·485 시리얼 통신 규격 및 ModBus를 지원하는 19랙형 디바이스다. 해당 제품에는 이중 전원 시스템이 장착됐는데, 이는 사용자 사용 환경에 맞춰 터미널 블록 ,DC 전원 어댑터 중 선택해 전원단 구성이 가능한 장점이 있다. 특히 DC 어댑터는 스크류형 잠금(Locking) 방식을 적용해 전원 플러그가 탈거되지 않도록 안정성을 높였다. 또 최저 온도 –40℃에서 최고 온도 85℃까지 활용 가능한 설계를 갖췄고, ESD 방지 기능과 과전류 방지를 위한 Surge 기능도 적용했다. SG-1161RIL/ALL는 병원·공장·빌딩 등 산업 분야에서 제어·모니터링·자동화 등 영역에 활용될 것으로 전망된다. 한편 아이솔레이션 컨버터 CS-428i V2.0은
브로드컴, HBA와 관련해 경쟁사와의 상호 운용성 등 보장 약속해 유럽연합(EU) 경쟁총국이 12일(현지시간) 미 반도체회사 브로드컴의 VM웨어 인수를 최종 승인했다. EU 집행위원회(이하 집행위)는 이날 보도자료를 내고 브로드컴의 610억 달러 규모 인수 거래를 조건부 승인했다고 밝혔다. 집행위가 제기한 경쟁 제한 우려 해소를 위해 브로드컴이 제시한 시정 방안을 이행하는 대가로 기업결합을 승인했다는 의미다. 브로드컴은 파이버 채널(FC)과 서버를 연결하는 입출력 어댑터인 HBA(Host Bus Adapter)와 관련해 공정한 경쟁을 위해 경쟁사와의 상호 운용성 등을 보장하겠다고 약속했다. 앞서 EU 경쟁총국은 작년 12월 브로드컴의 VM웨어 인수로 서버 부문 경쟁이 약화할 수 있다며 심층 조사를 개시한 바 있다. 이와 별개로 현재 미 연방거래위원회(FTC)와 영국 경쟁시장청(CMA)도 각각 브로드컴-VM웨어의 기업결합 조사를 진행 중이다. 헬로티 서재창 기자 |
딥엑스 고성능·저전력 AI 반도체 4종, 삼성 파운드리 5나노, 14나노, 28나노 공정 활용 딥엑스는 ‘2023 삼성 파운드리 포럼(SFF)에 참가해 ‘AI를 모든 곳에 존재하게 하는 기술’이란 주제로 AI 반도체의 글로벌 스탠다드를 알렸다. 이번 행사의 발표를 맡은 김녹원 대표는 삼성 파운드리와 협력을 통해 AI 반도체의 원천기술 국산화에 도전하고 있으며 이를 위해서는 세계 일류의 기술이어야 한다고 말했다. 딥엑스는 현재 다양한 엣지 및 서버 AI 응용 분야를 공략하기 위한 고성능·저전력 AI 반도체 4종을 삼성 파운드리 5나노, 14나노, 28나노 공정을 활용해 개발을 완료했다. 이는 데이터 처리량이 적은 초소형 센서부터 CCTV, 머신비전, 가전, 로봇뿐 아니라 고성능 AI 알고리즘 연산을 요구하는 자율주행차, 스마트 팩토리, AI 연산처리 서버까지 체급별로 최적화된 AI 연산 성능과 다양한 기능 조합으로 구성돼 있다. 현재 딥엑스는 모든 검증을 마친 후 고객사에 ES(Evaluation Sample) 버전으로 배포해 응용 제품의 양산 개발을 위한 실전 평가를 진행하고 있다. 딥엑스의 기술 혁신은 GPU에서나 동작 가능했던 고성능·최신 AI 기술을 G
TLC SSD와 동등한 읽기 성능 제공하고 대용량으로 스토리지 TCO 절감 솔리다임이 18일 메인 스트림 및 읽기 집약적인 워크로드에 최적화된 새로운 QLC SSD ‘솔리다임 D5-P5430’를 출시해 자사의 D5 제품군을 확장한다고 밝혔다. 오늘날 대부분의 엔터프라이즈 애플리케이션이 읽기 중심으로 제공되며, 그 중에서도 4세대 PCIe QLC SSD D5-P5430은 가장 널리 채택된 TLC SSD와 동등한 읽기 성능을 제공하고 큰 용량으로 스토리지의 총 소유 비용(TCO)을 절감시킨다. D5-P5430은 이메일·통합 커뮤니케이션, 의사 결정 지원 시스템, 오브젝트 스토리지 및 가상 데스크톱 인프라와 같은 메인스트림 워크로드와 콘텐츠 전송 네트워크, 데이터 레이크·파이프라인, VOD 등의 읽기 집약적인 워크로드에 최적화됐다. 이러한 워크로드는 일반적으로 80% 이상의 읽기를 수행하고 대량의 데이터를 빠르게 처리한다. TLC 낸드 및 PCIe 기반 SSD의 드롭인 대체품인 D5-P5430은 스토리지 밀도를 1.5배 높이고, 에너지 비용을 18% 절감하여 일반적인 오브젝트 스토리지 솔루션의 총 소유 비용을 최대 27%까지 절감한다. 또한, 솔리다임의 최신 드라
10년 간 축적한 역량을 SaaS에 집중, 고성장·고수익 기업으로 전환할 계획 밝혀 로그프레소가 13일 여의도 콘래드호텔에서 진행한 창립 10주년 기념 기자간담회에서 클라우드 SIEM 전문기업으로의 비전을 발표했다. 양봉열 대표는 “선택과 집중이라는 키워드를 기치로 SaaS 기업으로 전환하는 여정을 시작했으며, 올 하반기부터는 로그프레소 클라우드 사업의 구체적인 성과를 확인할 것”이라며 “올해 매출 목표는 80억 원이며, 2027년까지 1000억 규모의 국내 클라우드 SIEM 시장에서 30% 점유율, 35% 이상의 이익률을 달성하겠다”고 포부를 밝혔다. 로그프레소는 지난 2013년 설립된 보안운영(SecOps) 플랫폼 기업으로 통합로그관리, 통합보안관제, 보안운영자동화 플랫폼을 제공 중이다. 설립 초기에는 LG유플러스, SK플래닛 등 통신 분야에서 매일 발생하는 테라바이트 단위의 대용량 로그를 고속으로 처리하며 시장에서 두각을 나타냈다. 이상금융거래 탐지시스템이 본격적으로 도입되던 시기에는 이체정보와 거래내역 등 빅데이터를 실시간으로 분석하는 기능을 앞세워 짧은 업력에도 가장 보수적인 시장인 은행과 증권 및 금융사에 제품을 공급했다. 통합 보안 관제(SIEM
데이터 관리, 데이터 보호 및 IT 인프라 보안에 걸친 새로운 솔루션 선보여 시놀로지가 연례행사 ‘Synology User Day Seoul 2022’의 일환으로 지난 9일 서울 더 플라자 호텔에서 국내 매체를 대상으로 기자 간담회를 개최했다. 시놀로지는 이번 간담회를 통해 팬데믹 이후 기업들이 주목하는 비즈니스 탄력성을 위한 새로운 솔루션을 다수 공개했다. 시놀로지가 공개한 솔루션은 기업이 탄력성을 높이고 원하는 바를 달성하도록 지원하는데 목적을 둔다. 시놀로지의 하이브리드 클라우드 아키텍처와 이에 긴밀하게 통합된 솔루션으로 확장된 하이브리드 클라우드 에코시스템은 기업이 맞닥뜨린 여러 IT 문제를 해결할 것으로 보인다. 시놀로지는 비즈니스 탄력성을 갖추기 위한 핵심 요소로 스토리지의 확장성, 유연성, 보안 등 세 가지를 꼽았다. 비즈니스 탄력성은 기업이 갑작스러운 변화에 유연하게 대응하거나 중대한 사고 발생 시 즉시 복구하도록 할 뿐 아니라 지속적으로 변화하는 새로운 환경에 맞게 운영 전략을 조정한다. 조앤 웡(Joanne Weng) 시놀로지 아시아 태평양 세일즈 총괄 책임은 "지난 3년간 우리는 다양한 산업에서 입지를 구축했다. 우리는 1000만 대 이상
이전 세대보다 2배 더 많은 코어와 2배 더 큰 메모리 대역폭 사용 IBM은 기업 애플리케이션 및 IT 운영을 현대화 및 자동화하는 ‘파워10’ 서버 제품군을 대폭 확대한다고 8일 밝혔다. 파워10 서버는 다양한 환경에서 새로운 서비스를 신속하게 배포하고자 하는 고객을 위해 향상된 성능·확장성·유연성을 제공하며, 이를 새롭게 선보이는 사용량 기반 지불 방식으로 서비스가 된다. 디지털 트랜스포메이션으로 인해 점차 많은 조직이 애플리케이션과 IT 인프라를 모두 현대화하는 추세다. IBM의 파워 시스템은 오늘날의 복잡한 비즈니스 환경에 최적화해 설계됐으며, 신제품인 Power10도 필수 워크로드를 실행하고, 컨테이너화된 애플리케이션의 효율성을 극대화하도록 최적화됐다. 레드햇 오픈시프트 기반의 에코 시스템은 고객과의 협력을 통해 워크로드를 새로운 클라우드 기반 서비스에 연결하도록 지원한다. 이번에 새롭게 출시하는 파워10 라인업의 신제품들은 고객의 IT 인프라 전반에서 안전하고, 회복력이 뛰어난 하이브리드 클라우드 경험을 제공하기 위해 지난해에 소개된 파워10 E1080 서버와 같은 제품군에 속하게 된다. 이전 세대보다 2배 더 많은 코어와 2배 더 큰 메모리 대역
삼성전기가 22일 반도체 패키지기판(FCBGA) 시설 구축에 약 3000억 원 규모의 추가 투자를 진행한다고 밝혔다. 이번 투자는 기술력을 인정받은 FCBGA의 국내 부산, 세종사업장 및 해외 베트남 생산법인에 대한 시설 투자에 쓰일 예정이다. 삼성전기는 이번 투자로 반도체의 고성능화 및 시장 성장에 따른 패키지기판 수요 증가에 적극 대응할 계획이다. 특히 국내 최초로 서버용 패키지기판을 연내 양산해 서버, 네트워크, 전장 등 하이엔드급 제품 확대를 통해 글로벌 3강 입지 강화에 나선다. 패키지기판은 고집적 반도체 칩과 메인 기판을 연결해 전기적 신호와 전력을 전달하는 기판으로, 고성능 및 고밀도 회로 연결을 요구하는 CPU(중앙처리장치), GPU(그래픽 처리장치)에 주로 사용된다. 반도체 업계는 로봇, 메타버스, 자율주행 등 반도체 성능 향상에 대응할 수 있는 기판 기술을 필요로 하고 있다. 빅데이터와 AI와 같은 고성능 분야에 필요한 하이엔드급 패키지기판은 기판 제품 중 미세회로 구현, 대면적화, 층수 확대 등 기술적인 난이도가 가장 높다. 모바일에 탑재되는 패키지기판을 아파트에 비유한다면, 서버와 같은 하이엔드급은 100층 이상의 초고층 빌딩을 짓는 것