
씨이랩은 자체 개발한 기업용 비전언어모델(Vision-Language Model, VLM)을 공식 출시하고 자사의 대표 AI 영상 분석 플랫폼 XAIVA(엑스아이바)와 클라우드 영상 분석 서비스 VidiGo(비디고)에 본격 탑재했다고 31일 밝혔다.
씨이랩의 기업용 VLM은 영상 데이터를 텍스트와 결합해 높은 수준의 인지 및 분석 능력을 제공한다. 특히 객체 분류, 자세 추정, 얼굴 인식 등 130종 이상의 Vision AI 모델을 보유하고 있으며 이를 바탕으로 영상속 객체와 상황을 정확히 파악해 실시간으로 이상 징후 탐지 및 대응이 가능하다.
VLM이 탑재된 VidiGo는 대용량 영상 데이터를 자동으로 요약하고 문맥 기반 검색(Contextual Query Matching) 기능을 제공한다. 예를 들어 사용자가 단순히 영상을 업로드하고 키워드나 질문을 입력하는 것만으로 AI가 필요한 장면을 자동 탐색하고 앞뒤 맥락을 파악해 요약 결과를 클립과 문서 형태로 동시에 제공한다. 대용량 영상 검색 및 분석이 필요한 미디어 및 기관에 납품돼 활용되고 있다.
CCTV 기반 실시간 영상분석 플랫폼 XAIVA는 VLM을 적용해 프롬프트 기반 이벤트 탐지 기능을 제공한다. 사용자가 ‘작업자 안전모 미착용’과 같은 특정 조건을 텍스트로 입력하면 VLM이 이를 해석하고 해당 상황을 탐지해 즉시 알림을 제공한다. 고속탐지 및 정밀 판독 기반으로 바이오, 제조업, 반도체, 보안, 해양 산업 등에서 품질 관리 및 이슈 신속 대응에 활용되고 있다.
향후 씨이랩은 VLM 모델을 디지털 트윈 플랫폼과 연계해 AI가 감지한 이벤트에 따라 실제 장비를 제어하거나 시뮬레이션을 할 수 있는 피지컬 AI(Physical AI) 솔루션 개발을 가속화할 방침이다.
윤세혁 씨이랩 대표는 “AI가 스스로 인식하고 판단하며 행동까지 수행할 수 있는 피지컬 AI 시대를 준비하기 위해서는 AI가 영상을 정확히 이해하고 판단하며 자율적으로 행동할 수 있는 환경을 구축하는 것이 중요하다”며 “씨이랩의 VLM 기술을 중심으로 기업에서 적용가능한 AI 솔루션을 지속적으로 확장해 나가겠다”고 말했다.
헬로티 이창현 기자 |