로민이 행정안전부와 과학기술정보통신부가 추진하고 삼성SDS 컨소시엄이 수행한 ‘범정부 초거대 AI 공통기반 구현 사업’에 문서 데이터 처리 솔루션 ‘텍스트스코프 Doc 파서(Textscope® Doc Parser 이하 Doc 파서)’를 공급하고 구축을 완료했다. 해당 사업은 중앙·지방정부가 내부 행정망에서도 다양한 생성형 AI 서비스를 보안 우려 없이 공동 활용할 수 있도록 하는 정부 최초의 내부망 AI 공통기반 서비스다. 정부 업무 전반에 AI를 내재화해 정책 기획과 대국민 서비스 품질을 높이는 것을 목표로 추진됐다. 로민은 삼성SDS 컨소시엄의 기술 파트너로 참여해 ‘범정부 AI 공통기반’과 연계 서비스가 활용할 공공 행정 문서를 거대언어모델이 학습·이해할 수 있는 형태로 구조화·정제하는 전처리 영역에 Doc 파서를 적용했다. 공공 문서 데이터를 생성형 AI 활용에 적합한 형태로 가공하는 역할을 맡았다. 로민이 공급한 Doc 파서는 공문서와 보고서, 각종 양식 등 다양한 행정 문서에서 텍스트와 표, 그림 등 핵심 요소를 추출하고 문서의 레이아웃과 읽기 순서를 함께 인식하는 문서 레이아웃 분석 솔루션이다. 원문의 구조와 맥락을 보존한 상태로 데이터를 구조화
다큐먼트 AI 전문기업 로민이 진실화해를위한과거사정리위원회의 과거사 조사 업무 지원을 위해 자사 다큐먼트 AI 플랫폼 텍스트스코프 스튜디오 구축을 완료했다. 이번 프로젝트는 위원회가 보유한 과거 사건 기록물 가운데 디지털 전환이 필요한 이미지 기반 문서를 정밀하게 인식하고 이를 구조화된 데이터로 전환하기 위해 추진됐다. 대상 문서에는 사진 촬영된 실환경 문자 이미지와 노이즈가 많은 고문서 영문 타자체 등 다양한 형태의 역사 자료가 포함됐다. 로민은 딥러닝 기반 AI OCR 솔루션 텍스트스코프 스튜디오를 적용해 고문서에 포함된 영문 타자체를 비롯한 여러 유형의 문서를 높은 정확도로 인식했다. 솔루션은 흔들림과 왜곡, 저조도, 그림자, 팩스 노이즈 등 저품질 이미지에서도 안정적인 인식 성능을 보이며 타자체, 인쇄체, 필기체뿐 아니라 복잡한 서체와 임의 배치된 텍스트까지 정확히 처리할 수 있는 실환경 문자 인식 기술을 갖추고 있다. 회사는 이를 기반으로 역사 기록물의 디지털 전환 요구에 부합하는 품질을 확보했다고 설명했다. 이번 구축은 구독형 서비스 형태로 제공됐다. 로민은 초기 사용 환경 설정부터 계정 제공, 기술 안내, 실시간 지원 체계 마련까지 전반적인 운영