카카오가 국내 최초로 텍스트, 음성, 이미지 등 다양한 정보를 동시에 이해하고 처리할 수 있는 통합 멀티모달 언어모델 ‘카나나(Kanana)-o’를 공개했다. 1일 자사 테크 블로그를 통해 성능과 개발 후기까지 상세히 공개하며 기술적 진화를 강조했다. 카나나-o는 기존의 텍스트 기반 언어모델을 넘어, 음성과 이미지를 동시에 입력받아 의미를 분석하고 이에 맞는 텍스트나 음성으로 응답을 생성할 수 있는 모델이다. 카카오는 이미지에 특화된 모델 ‘카나나-v’와 오디오 처리에 특화된 ‘카나나-a’를 병합하는 방식으로 멀티모달 통합 모델을 단기간 내 구축했다. 특히 이번 모델은 한국어에 특화된 데이터셋을 기반으로 지역 방언, 억양, 어미 변화를 정밀하게 반영했다. 이를 통해 제주도, 경상도 등 지역 방언을 표준어로 자연스럽게 변환하는 능력을 갖췄으며, 해당 방언으로도 정확한 감정 인식이 가능하다. 카카오는 카나나-o가 한국어 및 영어 벤치마크에서 글로벌 최고 수준의 성능을 기록했으며, 특히 한국어 기반 벤치마크에서는 높은 우위를 보였다고 설명했다. 감정 인식 부문에서는 양 언어 모두에서 높은 정확도를 보이며, 단순 응답을 넘어 감정 기반 소통이 가능한 AI의 가능성을
AI 서비스 고도화를 위한 기술 협력, 공동 상품 개발 추진 예정 카카오는 4일 서울 중구 더플라자에서 인공지능(AI) 분야 선도 기업인 오픈AI와 전략적 제휴 체결에 대한 공동 기자간담회를 열었다. 이날 간담회에는 정신아 카카오 대표와 샘 올트먼(Sam Altman) 오픈AI 최고경영자(CEO)가 직접 참석해 양사의 협력 방향성을 공유했다. 오픈AI가 전략적 제휴를 체결한 것은 국내에서 카카오가 처음으로, 카카오와 오픈AI는 많은 이용자가 AI 서비스를 쉽게 사용할 수 있도록 하는 데 초점을 맞춰 AI 서비스 고도화를 위한 기술 협력, 공동 상품 개발을 추진할 예정이다. 정신아 대표는 키노트 발표에서 “오랜 기간 국민 다수의 일상을 함께 하며 축적해 온 역량을 바탕으로 ‘이용자를 가장 잘 이해하는 개인화된 AI’를 선보이는 것이 지금 시대 카카오의 역할일 것”이라며, “글로벌 기술 경쟁력을 보유한 오픈AI와 협력해 혁신적 고객경험을 제공함으로써 AI 서비스의 대중화를 이끌겠다”고 제휴 배경을 설명했다. 카카오와 오픈AI는 지난해 9월부터 ‘AI 서비스 대중화’라는 동일한 목표 아래 기술과 서비스, 사업 등 다양한 범위에서 협력 방안을 논의해 왔다. 그 결과