데이터브릭스(Databricks)는 비기술 사용자도 코드 개발 없이 손쉽게 데이터 파이프라인을 구축할 수 있는 새로운 노코드 ETL 기능 ‘레이크플로우 디자이너(Lakeflow Designer)’의 프리뷰 버전을 공개할 예정이라고 13일 밝혔다. 레이크플로우 디자이너는 직관적인 드래그 앤 드롭 방식의 시각적 인터페이스와 자연어 기반의 생성형 AI 도우미를 제공해 기술적 전문 지식이 없는 사용자도 운영 환경 수준의 데이터 파이프라인을 쉽게 설계하고 구축할 수 있도록 돕는다. 이 기능은 데이터브릭스의 통합 데이터 파이프라인 솔루션인 ‘레이크플로우(Lakeflow)’를 기반으로 한다. 레이크플로우는 데이터 엔지니어들이 모든 비즈니스 핵심 데이터를 활용해 신뢰할 수 있는 파이프라인을 더 빠르게 구축할 수 있도록 설계된 솔루션으로 현재 정식 출시됐다. 전통적으로 기업은 데이터 파이프라인 구축에 있어 어려운 선택지에 직면해 왔다. 분석가가 노코드 또는 로우코드 도구를 사용해 파이프라인을 직접 구축하도록 허용하면 거버넌스, 확장성, 신뢰성 측면에서 한계를 감수해야 했고, 반대로 운영 수준의 파이프라인을 코드로 개발하려면 데이터 엔지니어링 팀에 의존해야 했다. 그러나 엔지
옴니버스·코스모스 등 자사 플랫폼과 연동한 휴머노이드 로봇 개발 솔루션 제시 “핵심은 모방학습 기술...방대한 동작 데이터 구현 가능해” 젠슨 황(Jensen Huang) 엔비디아 창립자 겸 최고경영자(CEO)가 ‘제58회 국제전자제품박람회(CES 2025)’에서 휴머노이드 로봇 개발 플랫폼 ‘엔비디아 아이작 GR00T 블루프린트(NVIDIA Isaac GR00T blueprint)’를 공개했다. 이 플랫폼은 차세대 휴머노이드 로봇 개발을 가속화하는 기술이다. 방대한 합성 모션 데이터를 생성해 개발자가 모방학습(Imitation Learning)을 구현하도록 지원한다. 쉽게 말해, 로봇 합성 모션 데이터세트(Dateset)를 쉽게 구성할 수 있도록 돕는다. 모방학습은 각 현장에서 수행되는 작업자의 업무 데이터를 인공지능(AI)이 학습한 후 로봇이 이 동작을 그대로 수행하도록 하는 기술이다. 엔비디아 아이작 GR00T 블루프린트는 이 과정에서 로봇 학습 모델인 ‘로봇 파운데이션 모델’, 데이터 흐름 전주기 시스템 ‘데이터 파이프라인’, 가상 로봇 테스트 환경 ‘시뮬레이션 프레임워크’ 등을 다룬다. 구체적으로 ‘GR00T-텔레옵(GR00T-Teleop)’, GR
파이프라인, 고품질의 데이터를 빠르게 확보하도록 클러스터 서버 기반으로 병렬 처리 스트라드비젼이 디지털 전환을 가속화하기 위해 데이터 파이프라인 자동화 시스템을 구축했다고 밝혔다. 데이터 파이프라인은 다양한 데이터 소스에서 수집된 원시 데이터를 분석이 용이한 형태로 변환해 데이터 웨어하우스로 저장하는 전처리 과정을 말한다. 데이터 파이프라인은 보통 ETL(Extracting, Transforming, Loading)을 포함하는 과정으로 진행되는데, SVNet의 경우 상대적으로 복잡도가 높고 정밀한 데이터로 학습하기 때문에 ETL 과정을 여러 단계로 세분화했다. 이러한 이유로 전체 과정이 복잡하고 더 많은 시간이 소요된다. 데이터 품질이 SVNet 성능에 많은 영향을 주기에, 스트라드비젼은 SVNet 고도화를 위해 자동화를 택했다. 스트라드비젼이 구축한 데이터 파이프라인 자동화 시스템은 크게 세 단계로, 전처리, 품질, 효율 파이프라인이다. 파이프라인은 SVNet의 성능을 높일 수 있는 고품질의 데이터를 빠르게 확보하도록 클러스터 서버 기반으로 병렬 처리되며 모든 데이터는 데이터 센터를 통해 처리된다. 데이터 센터는 스트라드비젼에서 자체 개발한 데이터 웨어하우