보통 그림과 글자가 함께 있을 때 사람의 시선이 그림에 먼저 가는 것처럼, 여러 감각을 동시에 활용하는 ‘멀티모달 인공지능’도 특정 데이터에 더 크게 의존하는 경향이 있다. KAIST 연구진은 이러한 한계를 극복해, 그림과 글자를 모두 고르게 인식해 훨씬 더 정확한 예측을 가능케 하는 새로운 멀티모달 인공지능 학습 기술을 개발했다. KAIST는 전기및전자공학부 황의종 교수 연구팀이 다양한 데이터 유형을 한 번에 처리해야 하는 멀티모달 인공지능이 모든 데이터를 고르게 활용할 수 있도록 돕는 새로운 학습 데이터 증강 기술을 개발했다고 14일 밝혔다. 멀티모달 인공지능은 텍스트, 영상 등 여러 데이터를 동시에 활용해 판단하지만, 기존 AI 모델은 특정 정보(예: 텍스트 또는 이미지)에 치우쳐 판단하는 경향이 있었다. 이로 인해 예측 정확도가 떨어지고, 실제 환경에서의 일반화 성능이 제한되는 문제가 있었다. 연구팀은 이러한 편향을 해결하기 위해 일부러 서로 어울리지 않는 데이터를 섞어서 학습에 사용했다. 이를 통해 인공지능은 특정 데이터에만 의존하지 않고, 글과 그림, 소리 등 모든 정보를 균형 있게 활용하는 방법을 학습하게 된다. 또한 품질이 낮은 데이터는 보완하
핵심 제품 공개를 비롯해 전략적 협력 기회 모색할 계획 밝혀 디노티시아가 오는 6월 26일부터 27일까지 서울 코엑스에서 열리는 아시아 최대 스타트업 행사 '넥스트라이즈 2025'에 참가해 데이터 중심 AI 기술력을 선보인다. 올해 행사는 1600여 개 스타트업과 250여 개 투자사·대기업이 참가하는 가운데, 디노티시아는 고성능 벡터DB와 온디바이스 LLM 디바이스 등 핵심 제품을 공개하며 전략적 협력 기회를 모색한다. 행사 첫날에는 정무경 대표가 ‘모델의 시대를 넘어 : 데이터가 이끄는 AI 혁명’을 주제로 Rise Stage에서 발표에 나선다. 그는 생성형 AI 기술이 모델 크기 중심의 경쟁에서 벗어나, 데이터 검색 및 추론 최적화 중심으로 전환되고 있음을 강조할 계획이다. 디노티시아는 ‘누구나 접근 가능한 보편적 AI’를 철학으로 삼고, 멀티모달 데이터 활용과 효율적 추론을 기반으로 AI의 대중화를 추구하고 있다. 이번 전시에서는 두 가지 주력 제품을 통해 그 비전을 구체화한다. 첫 번째는 고성능 벡터 데이터베이스 ‘씨홀스(Seahorse)’다. 텍스트, 이미지, 영상 등 다양한 멀티모달 데이터를 고차원 벡터로 색인하고, 유사도 기반 시맨틱 검색을 지원