MI300X GPU 32개 활용한 4노드 구성에서 H100 기반 시스템 대비 24% 높은 성능 보여 망고부스트가 글로벌 AI 성능 평가 벤치마크인 MLPerf Inference v5.0에서 새로운 추론 성능 기록을 달성하며, AI 인프라 솔루션 경쟁력을 입증했다. 망고부스트는 AMD Instinct MI300X GPU 기반의 추론 최적화 소프트웨어 ‘Mango LLMBoost’로 Llama2-70B 모델의 오프라인 시나리오에서 역대 최고 TPS(초당 토큰 처리량)를 기록했다. 이번 결과는 MI300X GPU 32개를 활용한 4노드 구성에서 나왔으며, NVIDIA H100 기반 시스템 대비 24% 높은 성능을 보여주며 AI 인프라 시장에 새로운 대안을 제시했다. 특히 비용 대비 성능비에서 2.8배의 경쟁력을 보이며, 특정 하드웨어에 의존하지 않고 고성능·고효율 AI 추론을 구현할 수 있는 가능성을 입증했다. 망고부스트의 Mango LLMBoost는 서버 시나리오에서 9만3039 TPS, 오프라인 시나리오에서 10만3182 TPS를 달성했다. 이는 이전 최고 기록인 8만2749 TPS를 크게 웃도는 수치다. 하드웨어 가격 또한 MI300X가 H100 대비 최대
에너지 및 원자재 산업에 특화한 고도화된 예측 서비스 제공하기 위해 협력 SK텔레콤(이하 SKT)이 글로벌 시장 데이터를 기반으로 AI 인텔리전스 역량을 강화한다. 그 중심에는 올해 상반기 출시 예정인 AI 기반 시장 예측 서비스 ‘AI 마켓 인텔리전스’가 있다. SKT는 3일 글로벌 무역 데이터 기업 케플러(Kpler)와 업무 협약(MOU)을 체결하고, AI 기반 시장 정보 분석 기술을 고도화하기 위한 협력에 나선다고 밝혔다. 이번 협약식은 지난 2일 서울 소공동 롯데호텔에서 열렸으며, 케플러 공동 창업자인 장 매이니어 회장이 직접 참석해 양사 간 파트너십의 기대감을 드러냈다. 케플러는 원유, 가스, 벌크화물, 전력, 해운 등 40여 개 시장의 실시간 데이터를 분석해 글로벌 트레이더와 산업 전문가에게 인사이트를 제공하는 데이터 전문 기업이다. 이번 협업은 SKT가 개발 중인 AI 마켓 인텔리전스 플랫폼에 이 같은 전문 시장 데이터를 결합해 에너지 및 원자재 산업에 특화된 고도화된 예측 서비스를 제공하는 데 목적이 있다. 양사는 LLM(거대언어모델) 기반의 AI 에이전트와 케플러의 시장 데이터를 연동하는 MCP(Model Context Protocol) 기술
저작권 등 법적 문제가 없는 안전한 데이터로 구성 크라우드웍스가 고품질 AI 학습용 데이터를 자유롭게 거래할 수 있는 플랫폼 ‘A1(에이원) 데이터 마켓플레이스’를 공식 오픈했다. AI 성능을 좌우하는 핵심 자산인 데이터의 품질과 접근성을 높이고자 구축된 이 플랫폼은 멀티모달 시대에 부합하는 국내 최대 규모의 AI 학습 데이터 거래소로 자리매김할 전망이다. A1 데이터 마켓플레이스는 의료, 금융, 통신, 리테일, 수학 등 다양한 산업군에 특화한 도메인 데이터는 물론, 텍스트, 음성, 이미지, 영상 등 멀티모달 데이터까지 포괄적으로 제공한다. 특히 크라우드웍스가 직접 구축하거나 검수한 고품질 데이터만을 엄선해 제공해 신뢰성과 활용도를 높였다. 구매자는 대형언어모델(LLM) 학습에 적합한 대규모 텍스트 데이터, 57만 트랙 규모의 다국어 오디오 데이터, 자율주행 및 영상 분석에 최적화된 이미지 데이터 등 다양한 용도의 데이터셋을 선택할 수 있다. 추론형 AI 모델 학습에 필요한 멀티모달 수학 문항 데이터셋도 7000건 규모로 마련됐다. 이 외에도 고객 맞춤형 어노테이션, 데이터 증강 및 합성 등 주문형 데이터 구축 서비스도 함께 제공된다. 플랫폼 내 거래되는 모
기업 실무자의 의사결정 과정에 효율성과 속도, 신뢰도 더할 것으로 보여 메이아이가 자사의 방문객 분석 솔루션 ‘매쉬(mAsh)’에 대화형 AI 기능 ‘매쉬 인사이트(mAsh Insights)’를 새롭게 탑재하고, 현장 중심의 실시간 전략 제안 기능을 강화했다. 이번 기능은 복잡한 방문객 데이터를 신속하게 해석하도록 돕고, 실무 중심의 실행 방안 도출까지 지원하는 데 초점을 맞췄다. 매쉬는 매장 내 설치된 CCTV 영상을 기반으로 자체 딥러닝 기술을 활용해 방문객 동선을 정밀하게 추적하고, 방문율, 구매 전환율 등 핵심성과지표(KPI)를 실시간으로 측정·분석하는 솔루션이다. 이번에 추가된 매쉬 인사이트는 이 분석 데이터를 대화형 인터페이스로 바로 질의하고 전략적으로 활용하도록 하는 기능으로, 기업 실무자의 의사결정 과정에 효율성과 속도, 신뢰도를 더한다. 사용자는 매쉬의 웹 대시보드 ‘매쉬보드(mAsh Board)’ 내 ‘AI 분석 기능’ 버튼을 클릭하고, 원하는 지표를 선택해 자연어로 질문을 입력하면 된다. 매쉬 인사이트는 질문에 포함된 목적을 자동 파악한 뒤, 사전 처리된 방문객 데이터를 기반으로 분석 결과를 응답 형식으로 제공한다. 특히, AWS의 완전
차세대 AI 데이터 센터 솔루션 앞세워 시장 페인포인트 공략 키사이트테크놀로지스 코리아(이하 키사이트)가 2일인 오늘 차세대 AI 인프라 솔루션 ‘KAI’ 출시를 기념해 기자간담회를 열었다. 행사에는 키사이트테크놀로지스 코리아 이선우 대표, 등 주요 관계자가 참석했으며, 급변하는 AI 산업 환경에서의 데이터 센터 최적화와 네트워크 문제 해결을 주제로 심도 있는 발표가 진행됐다. 오늘 진행된 발표에서 가장 주목을 받은 주제는 ‘KAI(KeySight AI)’를 중심으로 한 차세대 AI 데이터 센터 솔루션이었다. 이선우 대표는 키사이트가 지난 10년간 ‘제품 중심의 계측기 회사’에서 ‘소프트웨어 중심 솔루션 기업’으로 탈바꿈해 왔다고 강조했다. 그는 “AI 산업에서는 피지컬 레이어에서 애플리케이션 레이어까지 모든 계층을 아우르는 솔루션이 필요하다”며, “KAI는 이러한 흐름 속에서 필연적으로 등장한 플랫폼”이라고 말했다. 특히 '패스웨이브(PathWave)'라는 통합 플랫폼을 도입하며, 다양한 소프트웨어와 장비가 유기적으로 연동되는 환경을 구현해 냈다는 점이 강조됐다. AI 기반 데이터 센터는 수많은 서버, GPU, 스위치, 케이블, 인터커넥트가 유기적으로 연결
운영과 관리에 초점 맞춘 전략으로 투자 유치 이뤄 렛서(Letsur)가 스톤브릿지벤처스와 KB인베스트먼트로부터 Pre-A 투자를 유치했다. 투자 금액은 비공개지만, 이번 라운드에 기존 투자사와 신규 투자사가 공동 리드로 참여하면서 렛서의 성장성과 비즈니스 모델에 대한 시장의 신뢰를 다시 한 번 입증했다. 렛서는 자체 플랫폼 ‘스테이엑스(Staix)’를 기반으로 기업의 AI 도입 이후 전 주기 운영과 관리를 지원해 온 기업이다. 특히 AI를 도입했지만 유지·보수에 어려움을 겪는 기업들을 대상으로, 전문 인력 없이도 AI 서비스를 안정적으로 운영할 수 있도록 돕는 것이 핵심이다. 렛서에 따르면 해당 솔루션을 통해 고객들은 AI 운영 비용을 최대 70%까지 절감할 수 있으며, 유지보수 인력 부족 문제도 해소할 수 있다. 스테이엑스는 대규모 데이터와 복잡한 프로세스를 다루는 조직에서도 적용 가능한 구조로 설계돼, 현재까지 150개 이상의 고객사를 확보했다. 그중에는 스타트업부터 대기업까지 다양한 규모의 기업이 포함되어 있으며, 70% 이상의 높은 고객 유지율을 기록 중이다. 이를 바탕으로 렛서는 지난해 매출이 전년 대비 200% 이상 성장했으며, 올해 1분기에 이미
AWS의 AMI 기반으로 제공되며, 손쉽게 AI 환경 구축할 것으로 보여 솔트룩스가 자사 대형 언어 모델(LLM) ‘LUXIA 2.5’를 아마존웹서비스(AWS) 마켓플레이스를 통해 공식 출시했다. 이번 출시는 한국 리전에 처음 개설된 AWS 마켓플레이스를 통해 이뤄진 것으로, 국내 고객이 클릭 몇 번만으로 솔트룩스의 생성형 AI를 활용할 수 있는 길이 열렸다. LUXIA 2.5는 AWS의 Amazon Machine Image(AMI) 기반으로 제공되며, 사용자들은 손쉽게 AI 환경을 구축하고 모델을 배포할 수 있다. 솔트룩스는 이번 사전 등록 파트너로 선정돼 LUXIA 2.5를 가장 먼저 등록한 국내 LLM 기업으로 자리매김했다. AWS 마켓플레이스는 머신러닝, 보안, 데이터 분석, 네트워킹 등 다양한 클라우드 기반 솔루션을 거래하는 세계 최대 규모의 소프트웨어 마켓플레이스로, 이번에 처음으로 한국 리전에서도 서비스를 시작했다. 이를 통해 국내 기업은 간편한 방식으로 AI 서비스를 도입하고 운영할 수 있게 됐다. 솔트룩스는 앞으로 Goover 기반 AMI, JumpStart 기반 LLM 서비스, 구독형 API 및 SaaS 서비스 등으로 제품군을 확장할 계획이
씨이랩이 자사 GPU 최적화 솔루션 ‘AstraGo’의 보안 기능을 대폭 강화한 업그레이드 버전 ‘AstraGo 2.0’을 새롭게 선보였다. 이번 업데이트를 통해 AstraGo는 단순한 자원 최적화 도구를 넘어, 보안까지 아우르는 통합 MLOps 플랫폼으로 한 단계 진화했다. AstraGo는 AI 모델 개발 및 운영 과정에서 GPU 자원을 효율적으로 관리할 수 있도록 지원하는 머신러닝 운영(MLOps) 솔루션이다. 관리자 입장에서는 리소스 자동 배분을 통해 인프라 활용도를 높일 수 있고, 개발자는 별도 설정 없이 사전 구성된 환경에서 즉시 머신러닝 작업을 시작할 수 있어 생산성과 효율성 모두를 만족시킨다. 최근 컨테이너 기술이 머신러닝 개발 환경에 빠르게 확산되면서, 컨테이너 내 보안 취약점에 대한 우려도 함께 커지고 있다. 실행 프로그램, 코드 구성 요소에 대한 검증이 부족할 경우, 시스템 전반에 보안 위협을 초래할 수 있기 때문이다. 이에 씨이랩은 AstraGo 2.0에 AI 기반의 ‘보안 취약점 검사’ 기능을 추가해 컨테이너 및 학습 시스템 전체의 위험 요소를 실시간으로 감지하고, 선제적으로 대응할 수 있도록 했다. 사용자는 개발에 필요한 외부 또는 내
패러닷이 구글 딥마인드의 최신 영상 생성 모델 ‘Veo 2’를 정식 도입하고, 국내 기업 중 처음으로 서비스에 적용했다. Veo 2는 고도화된 물리 기반 이해와 정밀한 프롬프트 처리 능력을 바탕으로, 보다 사실적이고 자연스러운 고품질 영상을 생성하는 차세대 모델로 주목받고 있다. Veo 2는 기존 AI 영상 생성 모델과 비교해 인물 동작, 공간 구성, 카메라 움직임 등에서 탁월한 표현력을 갖춘 것이 특징이다. 다양한 렌즈 효과와 영화적 기법도 자연스럽게 반영할 수 있어, 크리에이터의 창의성을 영상에 그대로 녹여낼 수 있는 점이 강점이다. 사용자의 프롬프트를 충실하게 반영하는 응답 성능 또한 향상돼 정교한 영상 콘텐츠 제작이 가능해졌다. 캐럿은 구글의 정식 승인을 받아 현재 Veo 2를 클로즈드 베타 형태로 일부 기업 고객에게 우선 제공하고 있다. 현재는 5초 길이의 720p 해상도 영상 생성이 가능하며, 향후 4K 화질과 최대 2분 길이까지 확장할 계획이다. Veo 2 도입을 기념해 오는 7일까지 해당 기능에 대해 30% 할인 프로모션도 진행 중이다. 장진욱 패러닷 대표는 “캐럿이 국내 대표 AI 영상 플랫폼으로서 글로벌 최고 수준의 모델을 빠르게 탑재할 수
알리바바 클라우드가 새로운 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’를 공개했다. Qwen2.5-Omni-7B는 텍스트, 이미지, 음성, 영상 등 다양한 입력 정보를 실시간으로 처리하며, 자연스러운 텍스트 응답과 음성 출력을 동시에 지원하는 이 모델은 모바일 기기와 노트북 등 엣지 디바이스에 최적화된 멀티모달 AI의 새로운 기준을 제시한다. 이번에 공개된 Qwen2.5-Omni-7B는 70억 개 파라미터 규모의 컴팩트한 구조에도 불구하고, 고성능 멀티모달 처리 능력을 제공한다. 실시간 음성 상호작용, 음성 기반 명령 수행, 시청각 데이터 통합 해석 등에서 우수한 성능을 발휘하며, 시각 장애인을 위한 실시간 음성 안내, 동영상 기반 요리 가이드, 지능형 고객 응대 시스템 등 다양한 실용적 활용이 가능하다. 알리바바 클라우드는 해당 모델을 허깅페이스(Hugging Face), 깃허브(GitHub), 모델스코프(ModelScope) 등 주요 오픈소스 플랫폼을 통해 공개했으며, 자사의 멀티모달 챗봇 서비스 ‘큐원 챗(Qwen Chat)’에서도 활용할 수 있도록 했다. 알리바바 클라우드는 현재까지 총 200개 이상의 생성형 AI 모델을 오픈소스로
크라우드웍스가 가트너의 ‘이노베이션 가이드 포 제너레이티브 AI’ 보고서에서 ‘생성형 AI 엔지니어링’ 부문 이머징 스페셜리스트로 이름을 올렸다. 이는 국내 기업 중 보기 드문 사례로, 크라우드웍스가 AI 엔지니어링 분야에서 글로벌 경쟁력을 인정받았다는 점에서 의미가 크다. 가트너는 이번 보고서에서 생성형 AI 기술 시장을 네 가지 세부 영역으로 구분했다. 이는 생성형 AI 특화 클라우드 인프라, 모델 공급 기업, 생성형 AI 엔지니어링, AI 기반 지식관리 및 생산성 향상으로 나뉘며, 이 중 크라우드웍스는 글로벌 소프트웨어 컨설팅 기업 쏘트웍스(Thoughtworks), 나스닥 상장사 이노데이터(Innodata)와 함께 생성형 AI 엔지니어링 부문 유망 기업으로 선정됐다. 생성형 AI 엔지니어링은 단순한 모델 개발을 넘어 실제 비즈니스 환경에서 생성형 AI를 안정적이고 효과적으로 운영할 수 있도록 지원하는 기술 전반을 아우른다. 크라우드웍스는 다양한 파운데이션 모델에 대한 선택과 맞춤 적용, RAG(Retrieval-Augmented Generation), CoT(Chain of Thought) 등 고도화된 프롬프트 설계, 파인튜닝, LLMOps, AI 평
데프니 티엔(Daphne Tien) 마우저 APAC 마케팅 및 사업개발 부사장 인터뷰 마우저 일렉트로닉스(이하 마우저)가 스마트팩토리 시장에 본격적으로 드라이브를 걸었다. 마우저는 유통 포트폴리오를 반도체에서 산업 자동화 중심으로 전환하며, AI와 연계한 센서 및 자동화 솔루션 수요 확대에 대응했다. 특히 아시아 태평양 지역에서의 비즈니스 회복을 위한 전략적 행보가 눈에 띈다. 최근 확장된 물류창고에 자동화 설비를 선제적으로 도입한 것도 그 일환이다. 이에 데프니 티엔(Daphne Tien) 마우저 APAC 마케팅 및 사업개발 부사장을 만나 비즈니스 현황과 향후 전략에 대해 이야기 나눠봤다. 기술 파트너로 자리매김한 마우저 마우저는 글로벌 공급망 불안과 무역갈등 속에서도 새로운 제조사와 파트너십을 확대하고, 아시아 시장에서의 점유율 1위를 유지하며 수익성 향상에 집중하고 있다. 특히 마우저는 지난해에 이어 올해 두 번째로 ‘2025 스마트공장·자동화 산업전(Smart Factory·Automation World 2025, 이하 AW 2025)’에 참가해 자사가 제조업 고객과의 접점을 넓히고 미래 성장 동력인 산업용 AI 제품군을 집중 조명하는 자리로 마련했다
고성능 게임 서버와 확장 가능한 데이터베이스 환경 제공할 계획 엔씨소프트와 베트남 IT기업 VNG의 합작법인 NCV GAMES가 대표 MMORPG ‘리니지2M’의 동남아시아 출시를 앞두고, 구글 클라우드와 손잡고 게임 운영 환경을 구축한다. NCV GAMES는 오는 5월, 리니지2M을 베트남, 태국, 필리핀, 인도네시아, 말레이시아, 싱가포르 등 6개국에 첫 출시하며 본격적인 시장 공략에 나선다고 밝혔다. NCV GAMES는 다양한 국가에서 안정적인 서비스를 제공하기 위해 글로벌 인프라 경쟁력을 갖춘 구글 클라우드를 파트너로 선택했다. 구글 클라우드는 유튜브, 지메일, 크롬 등 전 세계 20억 명 이상이 사용하는 서비스를 운영 중인 플랫폼으로, 그간 수많은 글로벌 콘텐츠 서비스의 기술 기반을 제공해 왔다. 이번 협업을 통해 구글 클라우드는 리니지2M 이용자가 동남아 지역 어디에서 접속하더라도 일관된 플레이 경험을 제공하도록 고성능 게임 서버와 확장 가능한 데이터베이스 환경을 제공한다. 대규모 접속자 증가에도 유연하게 대응할 수 있는 점은 동시접속자 수가 중요한 MMORPG 장르에서 핵심 경쟁력으로 작용할 전망이다. 특히 양사는 생성형 AI 기술을 게임 개발
기존 E5 인스턴스 대비 최대 2배 향상된 비용 대비 성능 제공 AMD의 최신 서버용 CPU인 5세대 에픽(EPYC) 프로세서가 오라클 클라우드 인프라스트럭처(OCI)의 새로운 E6 컴퓨팅 스탠다드 플랫폼에 적용된다. 양사는 이번 협력을 통해 엔터프라이즈, AI, 클라우드 등 다양한 고성능 워크로드에 최적화한 클라우드 인프라를 제공한다는 전략이다. AMD에 따르면, 5세대 에픽 프로세서가 적용된 OCI E6 플랫폼은 기존 E5 인스턴스 대비 최대 2배 향상된 비용 대비 성능을 제공한다. 특히 범용 및 컴퓨팅 집약형 워크로드에 대응하는 수준의 성능과 효율성을 갖췄다는 점에서 주목받고 있다. 이를 기반으로 1000개 이상의 새로운 컴퓨팅 인스턴스 선택권이 고객에게 제공될 예정이다. AMD 서버 비즈니스를 총괄하는 댄 맥나마라 수석 부사장은 “클라우드 파트너들이 AMD의 고성능 솔루션을 채택하는 것은 그만큼 AMD의 기술력이 시장에서 입증되고 있다는 의미”라며, “오라클의 유연한 인프라에 5세대 에픽 프로세서를 결합함으로써 고객들은 핵심 워크로드를 빠르게 실행하면서도 인프라 효율성을 극대화할 수 있다”고 강조했다. 오라클 클라우드 인프라 컴퓨팅 부문 수석 부사장
AI가 데이터 분석 및 문서화함으로써 보고 누락, 기록 지연 등의 문제 줄여 인텔리빅스가 지난 3월 27일 안산시 도시정보센터에서 열린 ‘일사천리 민생안전회의’에서 생성형 AI 기반 영상관제 시스템 ‘Gen AMS’를 시연했다. 이날 현장에는 이민근 안산시장과 경찰, 교육청 관계자 등이 참석해, 인공지능을 활용한 도시 안전관리 기술을 직접 확인했다. 안산시가 주관한 이번 회의는 통합관제센터의 현장 점검과 함께 지역 내 시민 안전 현안을 논의하고, 스마트 기술을 활용한 대응 체계를 검토하는 자리로 마련됐다. 인텔리빅스는 자사의 실시간 영상 인식 및 자동 보고 기능을 갖춘 ‘Gen AMS’ 시스템의 주요 기능을 시연하며, AI가 영상 관제를 어떻게 자동화할 수 있는지 설명했다. Gen AMS는 CCTV 영상 속 연기, 쓰러짐, 이상행동 등 주요 이벤트를 실시간으로 탐지하고, 해당 상황을 자동으로 정리해 사건 시간, 위치, 내용이 포함된 관제일지를 생성하는 시스템이다. 기존 영상관제 시스템이 수동 모니터링에 의존했던 것과 달리, Gen AMS는 AI가 데이터를 분석해 문서화까지 수행함으로써 보고 누락, 기록 지연, 내용 편차 등의 문제를 획기적으로 줄인다. 관제요