크라우드웍스가 과학기술정보통신부의 ‘독자 AI 파운데이션 모델 개발 사업’에 선정된 모티프테크놀로지스 컨소시엄에 데이터 공급 핵심 파트너로 합류했다. 이에 따라 크라우드웍스는 LG AI연구원 SK텔레콤 업스테이지 컨소시엄과 함께 국내 AI 생태계를 이끌 4대 정예팀의 일원으로 활동하게 됐다. 이번 사업에서 크라우드웍스는 3000억 파라미터급 300B 추론형 거대언어모델 개발을 위한 고품질 데이터 공급을 전담한다. 단순 데이터 가공을 넘어 단계별 추론 Chain-of-Thought에 특화된 학습 데이터셋 구축에 역량을 집중한다는 계획이다. 이는 모델의 논리적 사고와 문제 해결 능력을 좌우하는 핵심 요소로 평가된다. 특히 자체 개발한 비정형 문서 데이터 전처리 솔루션 ‘알피 날리지 컴파일러’를 투입한다. 표 차트 등 복잡한 구조를 가진 문서를 정교하게 파싱해 AI가 이해 가능한 AI-Ready 데이터로 변환함으로써 고복잡도 전문 지식 학습을 지원한다. 이를 통해 추론형 모델의 단계별 사고 구현을 뒷받침한다는 전략이다. 크라우드웍스는 그간 ‘국가대표 AI’ 정예팀에 고품질 학습 데이터를 지속 공급해 왔다. 저작권 문제를 해결한 도서 데이터 제공과 한국 사회의 언어
"실제로 문제를 이해하고 논리적으로 해결하며 실행까지 가능한 AI 모델” 업스테이지가 자체 개발한 차세대 거대언어모델(LLM) ‘솔라 프로 2(SOLAR PRO 2)’를 공식 출시했다. 전작 대비 대폭 향상된 추론 능력과 하이브리드 작동 모드를 탑재한 이번 모델은 AI가 단순한 대화형 도우미를 넘어 실질적인 작업 수행까지 가능한 ‘에이전트형 LLM’으로 진화했음을 보여준다. 솔라 프로 2는 전작 ‘솔라 프로’의 220억 매개변수 규모에서 310억 매개변수로 확장되며 모델 성능을 한층 끌어올렸다. 특히 이번 버전에는 업스테이지 LLM 최초로 하이브리드 모드가 도입돼 사용자는 빠른 응답을 위한 ‘챗 모드’와 논리적 문제 해결에 최적화한 ‘추론 모드’를 선택할 수 있다. 추론 모드에는 단계적 사고를 유도하는 ‘Chain of Thought(CoT)’ 기법이 적용돼 수학 문제 풀이나 코드 생성 같은 복잡한 작업에서 뛰어난 성능을 발휘한다. 실제 성능 지표에서도 눈에 띄는 성과를 보였다. 솔라 프로 2는 종합 지식(MMLU-Pro), 수학(Math500, AIME), 코딩(SWE-Bench) 등 고난도 벤치마크에서 GPT-4o, 미스트랄 스몰, 큐원 3 등의 글로벌