AI 'GPU 비용 다운 성능 업'…코난 ENT-11, LLM 판도 흔드나
일반 질의응답과 고난이도 추론을 하나의 엔진으로 통합해 코난테크놀로지가 자체 개발한 차세대 LLM(대규모 언어모델) ‘ENT-11’을 이달 말 공식 출시한다. 이번 모델은 일반 질의응답과 고난이도 추론을 하나의 엔진으로 통합해 GPU 비용을 줄이면서도 고성능을 유지할 수 있는 것이 가장 큰 특징이다. 코난테크놀로지는 이번 ENT-11 모델에 일반 모드와 추론 모드를 단일 모델로 통합하는 구조를 도입했다. 기존에는 각각 다른 모델을 운영해야 했던 방식과 달리, 하나의 엔진으로 모든 작업을 처리할 수 있어 운영 효율성과 비용 절감이라는 두 마리 토끼를 동시에 잡았다. 특히 복잡한 멀티턴 대화와 논리적 추론이 요구되는 환경에서도 최적의 응답을 제공할 수 있도록 설계됐다. ENT-11은 학습 단계에서 한국어 토큰 비중을 높게 설정한 것이 특징이다. 이로 인해 Qwen, LLaMA, Gemma, DeepSeek 등 글로벌 모델에 비해 한국어 기반 질의에서 처리 정확도와 응답 속도 모두에서 우위를 보인다. 코난테크놀로지는 자체 번역과 검수 과정을 거쳐 정교하게 구축한 ‘Konan MT-Bench’를 통해 ENT-11의 성능을 측정했다. 평가 결과 ENT-11은 동급 모