이제는 단순히 말만 하는 AI 음성비서를 넘어, 인공지능이 직접 화면을 보고 판단해 택시를 호출하고 SRT 티켓을 예매하는 시대가 열렸다. KAIST는 전산학부 신인식 교수가 이끄는 AutoPhone 팀(플루이즈·KAIST·고려대·성균관대)이 과학기술정보통신부가 주최한 ‘2025 인공지능 챔피언(AI Champion) 경진대회’에서 초대 AI 챔피언(1위)에 선정됐다고 6일 밝혔다. 이번 대회는 AI 기술의 혁신성과 사회적 파급력, 사업화 가능성을 종합 평가하는 국내 최대 규모의 AI 기술 경진대회로, 전국 630개 팀이 참가한 가운데 AutoPhone 팀이 최고 영예를 차지하며 연구개발비 30억 원을 지원받는다. AutoPhone 팀이 개발한 ‘FluidGPT’는 사용자의 음성 명령을 이해해 스마트폰이 스스로 앱을 실행하고 클릭·입력·결제까지 완료하는 완전 자율형 AI 에이전트 기술이다. 예를 들어, 사용자가 “서울역에서 부산 가는 SRT 예매해줘” 또는 “택시 불러줘”라고 말하면, FluidGPT는 실제 앱을 열고 필요한 단계를 순차적으로 수행해 결과를 완성한다. 이 기술의 핵심은 ‘비침습형(API-Free)’ 구조다. 기존에는 택시 앱(API)을 이용해
알렉사에 생성형 AI 탑재 위해 자체모델인 '타이탄' 활용할 것으로 알려져 아마존이 올해 말 대화형 인공지능(AI)을 탑재한 음성 비서 '알렉사(Alexa)'를 선보일 예정이라고 CNBC 방송이 소식통을 인용해 22일(현지시간) 보도했다. 최근 오픈AI와 구글, 애플에 이어 아마존도 대화형 AI를 탑재한 음성비서를 출시할 계획이 확인됨에 따라 텍스트 기반을 넘어서 사람과 음성으로 대화까지 할 수 있는 'AI 비서'를 둘러싼 경쟁이 치열해질 전망이다. 소식통은 아마존이 10년 된 알렉사 음성 비서를 생성형 AI로 업그레이드하며 기술 개발 비용을 상쇄하기 위해 매월 구독료를 부과할 계획이라고 전했다. 아직 구독료는 확정되지 않았지만, 아마존 프라임 회원 연간 구독료인 139달러에 포함되지 않는 것이라고 덧붙였다. 알렉사는 애플의 시리(Siri)와 같은 AI 음성 비서다. 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려주는 기능으로 출시 당시 인기를 끌었다. 그러나 챗GPT 등 생성형 AI 열풍이 불면서 오래된 버전이 됐다. 아마존은 알렉사에 생성형 AI를 탑재하기 위해 자체 개발한 거대언어모델 '타이탄'을 이용할 것으로 알려졌다. 아마존은 오픈AI와
[첨단 헬로티] 대화형 플랫폼은 사용자가 컴퓨터의 언어를 습득하지 않아도 컴퓨터가 사람의 언어를 이해할 수 있도록 도와 사용자의 부담을 덜어준다. 대화형 플랫폼은 아직 개발 초기 단계에 있는 기술이지만, 이 기술은 앞으로 대화의 맥락을 파악하고 사람과 복잡한 상호작용을 할 수 있도록 진화할 것이다. 즉, 미래의 대화형 플랫폼 기술은 상황에 따른 자율적인 판단을 통해 디바이스가 사람들과 교류가 가능하도록 할 것이다. 대화형 플랫폼은 사실상 모든 조직에 영향을 미친다. 가트너가 실시한 '2018 CIO 조사(2018 CIO 서베이)'에 따르면, 응답에 참여한 조직의 4%가 이미 대화형 플랫폼 기술에 투자하고 대화형 인터페이스를 활용 중인 것으로 나타났다. 또한 17%는 이 기술을 단기 계획으로 추진하거나 적극적인 실험이 진행 중인 것으로 답했다. 현재 대화형 플랫폼 시장은 가상개인비서(VPA), 가상고객비서(VCA), 가상직원비서(VEA), 챗봇으로 이뤄져 있다. 이러한 역할 기반 비서들은 2021년~2023년에 이르면 하나의 시장으로 통합될 것으로 예측된다. 미래에는 대화형 플랫폼이 생체인증, 동작인식, 감정인식, 말하는 스타일과 문화적/역사적 요소 등을 활용
[첨단 헬로티] 전세계에 처음으로 출시된 ‘스마트 스피커’인 아마존의 ‘에코(Echo)’는 선두 제품인 만큼 미국 스마트 스피커 시장에서 지속적으로 점유율 1위를 차지하며 압도적인 매출을 기록하고 있다. 이처럼 스마트 스피커의 대표 제품인 아마존 에코에 반도체 기업 텍사스인스트루먼트(Texas Instruments, 이하 TI)는 여러 주요 부품을 공급하며, 기술력을 인정받고 있다. 노성진 텍사스 인스트루먼트 코리아 부장을 만나 TI의 스피커 솔루션의 전략을 들어봤다. ▲ 노성진 텍사스 인스트루먼트 코리아 부장 TI는 종합 반도체 기업을 지향한다. 따라서 시스템 반도체와 관련해 다양한 포트폴리오를 보유하고 있다는 것이 장점이다. 이런 부분이 아마존의 스마트 스피커 에코 개발에도 영향을 끼친 것 같다. 개발사가 제품 개발 중 어떤 궁금증이나 문제점이 생길 경우, 한 반도체 회사에서 솔루션을 받을 수 있다는 편의성 때문에 다양한 포트폴리오를 보유한 TI를 선택했다고 본다. 물론 TI가 강력한 기술력을 보유하지 않았다면 불가능 했을 것이다. 아마존 에코에는 MEMS 마이크로폰, 메모리, 통신 모듈을 제외하고, 오디오, 파
[첨단 헬로티] ‘음성인식 비서 서비스’ 기술 성장과 더불어 정확한 음성 인식을 돕는 필수 반도체인 ‘MEMS(Micro Electro Mechanical System) 마이크로폰’이 주목받고 있다. MEMS 마이크로폰은 2002년에 미국의 놀스(Knowles)가 처음으로 선보였으며, 애플이 2012년 아이폰5에 ‘시리’ 서비스를 제공하기 위해 처음으로 놀스의 MEMS 마이크로폰을 채택하면서 시장이 급부상했다. 이후 스마트폰의 음성인식 비서 서비스 기능의 중요도가 커지면서, 보다 정확한 음성인식 기능을 제공하기 위해 아이폰의 MEMS 마이크로폰의 탑재 수가 점차 증가하고 있는 추세다. 아이폰6에 3개가 탑재됐던 MEMS 마이크로폰은 아이폰6S 시리즈부터 4개로 증가했다. 삼성전자, 샤오미, 화웨이, LG전자 등도 아이폰에 영향을 받아 스마트폰에 4개의 MEMS 마이크로폰을 탑재하기 시작했다. 또 태블릿과 스마트워치에서도 1~2개의 MEMS 마이크로폰을 탑재하고 있으며, 최근 가정용 인공지능 스피커가 급부상 함으로써 MEMS 마이크로폰의 수요가 빠르게 증가하고 있다. 더 나아가 향후 자율주행차에
[첨단, 헬로티] 2011년 애플이 스마트폰의 버튼 하나 누르지 않고 음성으로만 작동시키는 음성제어 기술인 ‘시리(Siri)’를 아이폰4S를 통해 선보였을 때, 우리는 기능의 편리함에 놀랍고 신기하기만 했었다. 인공지능 음성 제어 기술은 꾸준한 발전을 통해 ‘인공지능 음성 스피커’가 개발됐고, 이제는 우리의 집안 전체를 제어하고 작동시키고, 심지어 배달음식까지 주문시킬 수 있게 됐다. 인공지능 스피커 시장 현황과 이와 더불어 주목 받고 있는 인공지능 스피커의 핵심 반도체인 ‘MEMS 마이크로폰(MEMS Microphone)’의 기술 현황에 대해 알아보겠다. 또 음성 인식기반 스피커에 여러 솔루션을 공급하고 있는 텍사스인스트루먼트의 기술과 가트너의 ‘대화형 플랫폼’에 관한 의견을 들어본다. Part 1. 국내 통신 3사 중심으로 인공지능 음성비서 스피커 경쟁 2차전 Part 2. 인공지능 음성 스피커 성장의 핵심 기술 ‘MEMS 마이크로폰’ Part 3. Interview - “TI의 토탈 솔루션 전략, 스마트 스피커 시장에도 통했다&rdquo