사이냅소프트가 VLM과 AI 에이전트 기술을 결합한 신형 OCR 솔루션을 공개하며 비정형 문서 중심의 도큐먼트 AI 전환을 본격화했다. 도큐먼트 AI 전문기업 사이냅소프트는 시각 언어 모델과 AI 에이전트 기술을 결합한 ‘사이냅 OCR IX’를 출시하고, 기존 정형 서식 중심 OCR을 넘어 비정형 비즈니스 문서 영역까지 대응하는 ‘Agentic OCR’ 시대를 연다고 밝혔다. 회사는 이번 신제품을 통해 고도의 문맥 이해가 요구되는 문서 처리 환경에서 인공지능 전환을 주도한다는 전략이다. 사이냅 OCR IX의 핵심은 문서 유형과 처리량에 따라 AI 에이전트가 VLM, KVT, FormMaker 중 최적의 엔진을 자동 선택하는 구조다. 정형과 비정형 문서가 혼재된 환경에서도 별도 설정이나 수작업 개입 없이 처리 흐름을 최적화해 도입과 운영 전반의 효율성을 높이는 방식이다. 기존 사이냅 OCR이 유지해온 TTA 인증 한글 인식률 99.3%를 그대로 유지하면서 세 가지 엔진이 상호 보완적으로 작동하도록 설계됐다. 새롭게 결합된 VLM은 사전 학습 없이도 신규 양식을 즉시 처리할 수 있어 도입 기간을 단축한다. 비정형 문서에서도 문맥을 파악해 필요한 데이터를 추출하며
한국딥러닝이 제조업 현장에 특화된 문서 자동화 솔루션 ‘딥 에이전트 for 제조’를 출시했다. 이번 솔루션은 견적서·주문서 ERP 연동, 다국어 혼합 수기 문서 구조화, 장문 점검 보고서 핵심 정보 추출 등 다양한 제조업 문서 자동화 사례를 기반으로 개발됐다. 작업 지시서, 공정 이상 보고서, 설비 점검표, 공정 검사기록표 등 비정형 문서를 사전 학습 없이 자동 인식하고 구조화할 수 있는 것이 특징이다. 한국딥러닝이 4억 장 이상의 문서 데이터로 학습시킨 VLM(Vision-Language Model) 기술이 적용돼 이미지와 텍스트를 동시에 처리하고 문서 전체 구조와 의미를 이해한다. 이를 통해 특정 포맷에 의존하지 않고도 다양한 양식의 문서를 즉시 처리할 수 있다. 기존 OCR 솔루션은 포맷이 달라지면 별도 템플릿 구성과 반복 학습이 필요했으나, 이번 솔루션은 협력사별 상이한 양식이나 전산 미연동 종이 문서 처리에도 제약이 없다. 또한 제조업 현장의 특성을 반영해 공정별 용어·단위 사전이 탑재됐다. 사출공정의 ‘C/T’, ‘사출온도’, 검사공정의 ‘NG판정’, ‘편차’ 등 기존 OCR이 인식하기 어려웠던 전문 용어를 정확하게 인식한다. 수기 인식, 표 해석