로민이 행정안전부와 과학기술정보통신부가 추진하고 삼성SDS 컨소시엄이 수행한 ‘범정부 초거대 AI 공통기반 구현 사업’에 문서 데이터 처리 솔루션 ‘텍스트스코프 Doc 파서(Textscope® Doc Parser 이하 Doc 파서)’를 공급하고 구축을 완료했다. 해당 사업은 중앙·지방정부가 내부 행정망에서도 다양한 생성형 AI 서비스를 보안 우려 없이 공동 활용할 수 있도록 하는 정부 최초의 내부망 AI 공통기반 서비스다. 정부 업무 전반에 AI를 내재화해 정책 기획과 대국민 서비스 품질을 높이는 것을 목표로 추진됐다. 로민은 삼성SDS 컨소시엄의 기술 파트너로 참여해 ‘범정부 AI 공통기반’과 연계 서비스가 활용할 공공 행정 문서를 거대언어모델이 학습·이해할 수 있는 형태로 구조화·정제하는 전처리 영역에 Doc 파서를 적용했다. 공공 문서 데이터를 생성형 AI 활용에 적합한 형태로 가공하는 역할을 맡았다. 로민이 공급한 Doc 파서는 공문서와 보고서, 각종 양식 등 다양한 행정 문서에서 텍스트와 표, 그림 등 핵심 요소를 추출하고 문서의 레이아웃과 읽기 순서를 함께 인식하는 문서 레이아웃 분석 솔루션이다. 원문의 구조와 맥락을 보존한 상태로 데이터를 구조화
한국딥러닝이 비정형 문서를 LLM 학습·검색용 구조 데이터로 변환하는 차세대 문서 구조화 솔루션 ‘DEEP Parser(이하 딥 파서)’를 정식 출시했다고 16일 밝혔다. 딥 파서는 문서의 레이아웃과 위계를 해석해 제목, 본문, 표, 캡션, 도형 등 최대 23종 요소로 자동 분류하고, PDF·HWP·JPEG 등 다양한 원본을 HTML, JSON, Markdown, XML로 변환한다. 복잡한 표 인식, 이미지 분석, 개인정보 보호 등 추가 기능은 선택형 모듈로 제공된다. 방대한 문서를 AI가 효율적으로 처리할 수 있도록 의미 단위로 자동 분할해주는 기능을 제공하며, 이를 통해 기업들은 문서 기반 AI 서비스 구축에 필요한 데이터 전처리 시간을 크게 단축할 수 있다. 또한 패키지를 단순화해 PoC에서 상용 전환까지의 속도를 높였고, ERP·RPA 등 기존 사내 시스템과의 연계를 고려해 API 연동 기능도 제공한다. 웹 기반 온라인 데모로 누구나 사용해볼 수 있도록 공개될 예정이며, 신청 기업은 실제 문서를 업로드해 구조화 결과를 직접 확인할 수 있다. 데모 링크는 사전 신청 기업을 대상으로 순차 발송된다. 한국딥러닝은 와이즈넛, 코난테크놀로지와의 협력을 통해 지
한국딥러닝이 경기도청의 ‘2025년 생성형 AI 플랫폼 구축사업’에 VLM 기반 문서 구조 분석 솔루션 ‘DEEP Parser’를 공급했다고 26일 밝혔다. 이번 프로젝트는 엠티데이타와 협력해 추진된다. 총 131억 원 규모의 이번 사업은 전국 광역지자체 행정업무에 생성형 AI 기술을 도입하는 첫 사례다. 약 11개월간 진행되는 프로젝트를 통해 경기도청은 문서작성, 회의관리, 정보검색 등 실무 중심의 AI 업무 지원 체계를 마련할 계획이다. 이번 사업의 핵심 목표는 경기도청 문서의 90% 이상을 차지하는 HWP, PDF 등 비정형 문서를 구조화된 데이터로 변환하는 것이다. 이를 위해 DEEP Parser는 행정문서와 정책자료를 정밀하게 디지털화·구조화해 AI 기반 실무지원 시스템의 핵심 데이터로 제공한다. DEEP Parser는 VLM(Vision Language Model) 기술을 활용해 단순한 텍스트 추출을 넘어 표, 차트, 계층구조, 병합 셀 등 문서의 의미와 구조를 동시에 분석한다. 이를 통해 AI 에이전트가 활용할 수 있는 고품질 지식 데이터베이스를 구축한다. 이 솔루션을 통해 ▲비정형 문서의 정밀 디지털화 및 구조화 ▲정책 문서·보고서의 정보 추출