AI SKT, 한국어 특화 LLM ‘A.X 4.0’ 공개...GPT-4o보다 토큰효율 높아
Qwen 2.5에 방대한 한국어 데이터를 추가 학습시킴으로써 국내 환경에 최적화 SK텔레콤(이하 SKT)이 세계 최고 수준의 한국어 특화 대규모 언어모델(LLM) ‘A.X(에이닷 엑스) 4.0’을 오픈소스로 공개했다. 7월 3일 SK텔레콤은 글로벌 오픈소스 플랫폼 허깅페이스를 통해 720억 개(72B)의 파라미터를 가진 표준 모델과 70억 개(7B)의 경량 모델 등 두 가지 버전을 동시에 공개했다. A.X 4.0은 오픈소스 기반 모델인 Qwen 2.5에 방대한 한국어 데이터를 추가 학습시켜 국내 환경에 최적화한 성능을 구현한 것이 특징이다. 특히 SK텔레콤이 자체 설계한 토크나이저를 탑재해 동일한 한국어 문장 입력 시 GPT-4o보다 약 33% 높은 토큰 효율을 기록했다. 이는 정보 처리량 증가와 함께 운영 비용 절감이라는 두 마리 토끼를 잡을 수 있는 기술적 진보로 평가된다. 벤치마크 테스트에서도 성과가 두드러졌다. 한국어 능력 평가 지표인 KMMLU에서는 78.3점을 기록하며 GPT-4o(72.5점)를 웃돌았고, 한국 문화 이해도 평가인 CLIcK에서도 83.5점으로 GPT-4o(80.2점)를 앞질렀다. 이를 통해 A.X 4.0은 한국어와 한국 문화에 최