
아이서티는 고려대학교 MILI(멀티모달 인터랙티브 인텔리전스 연구소)와 ‘Vision-Language Model(VLM) 기반 지능형 영상보안 관제기술 개발’을 위한 산학협력 MOU를 체결했다고 27일 밝혔다.
이번 협약은 멀티모달 AI 기술을 접목한 차세대 영상보안 관제기술 개발을 위해 민간기업과 학계가 손을 잡았다는 점에서 업계의 주목을 받고 있다. 협력 주요 분야는 ▲오픈소스 대규모 언어모델(LLM)을 기반으로 한 VLM 기술 개발 ▲실시간 영상 내 보안 이벤트 자동 감지 ▲한국어 특화 LLM 기반 의사결정 지원 기술 연구 등이다.
VLM(Vision-Language Model)은 영상, 오디오, 자막 등 다양한 시각·청각 데이터를 동시에 분석한 뒤 대규모 언어모델(LLM)을 통해 상황을 종합 판단해 문맥 기반 리포트를 생성하는 AI 기술이다. 기존 영상보안 시스템이 단순 움직임 감지에 그쳤다면 VLM은 상황의 맥락까지 이해해 실제 위험상황을 정확히 구분할 수 있다.
특히 이번 프로젝트는 멀티모달 데이터를 활용해 문맥을 이해하고 이상 징후를 식별하는 AI 기술 구현에 집중한다. 기존 보안관제 시스템의 한계를 극복하고 산업 전반의 보안 패러다임 전환을 견인할 차세대 지능형 감시·판단 체계 구축에 기여할 것으로 기대된다.
고려대 서홍석 교수팀은 최근 5년간 CVPR, NeurIPS 등 세계 최고 수준의 AI 학회에 18편의 논문을 발표하며 VLM 기반 캡션 생성 모델 ‘VidSeq’ 등 선도적 멀티모달 AI 기술을 선보여 왔다.
프로젝트 PM은 스토리콘텐츠 팬플랫폼 ‘픽클스’를 운영하는 리틀빅휴먼의 유혜리 대표가 맡았다. 콘텐츠 기반 AI 모델 운영 경험과 복합 데이터 설계 역량을 바탕으로 기술과 현장 간의 접점을 유연하게 조율하며 연구개발의 실효성과 사업화를 함께 도모할 예정이다.
아이서티는 이번 산학협력을 토대로 기존 영상보안관제 솔루션에 생성형 AI 기술을 접목함으로써 오탐과 누락을 획기적으로 줄이고 의미 기반 검색·판단 기능을 강화한 차세대 보안관제 시스템 개발에 속도를 낼 계획이다.
김영후 아이서티 대표는 “텍스트, 영상, 오디오를 통합한 AI 기반 영상보안 기술의 새로운 출발점”이라며 “이번 협력이 보안관제 시스템의 지능화를 앞당기고 산업 전반의 보안 수준을 한 단계 끌어올리는 전환점이 될 것”이라고 말했다.
헬로티 이창현 기자 |