일반뉴스 엔비디아, AI 적용된 음성 인식 합성 기술 선보여
헬로티 서재창 기자 | 엔비디아의 모델들은 은행과 소매업계의 음성 자동화 고객 서비스 라인을 지원하고 비디오 게임과 소설 속 캐릭터에 생동감을 불어넣는 한편, 디지털 아바타용 실시간 음성 합성을 지원한다. 엔비디아 크리에이티브 팀은 AI의 위력을 다루는 비디오 시리즈에 삽입돼 풍부한 표현력을 자랑하는 내레이션에도 음성 합성 기술을 사용하고 있다. 표현적 음성 합성은 엔비디아 연구진이 대화형 AI 분야에서 진행 중인 여러 연구의 일부다. 대화형 AI는 음성 합성외에도 자연어 처리, 자동 음성 인식, 키워드 검출, 오디오 개선 등 여러 요소를 포함한다. 엔비디아 GPU에서 효율적으로 실행되도록 최적화된 최첨단 연구의 일부는 엔비디아 NeMo 툴킷을 통해 오픈소스로 제작됐으며, 엔비디아의 NGC 컨테이너 허브와 기타 소프트웨어에서 제공된다. 엔비디아 연구진과 크리에이티브 전문가들은 음성 합성 기술을 실제 사례에 접목해 대화형 AI의 위력을 증명하고 있다. 그 일환으로 엔비디아는 ‘아이엠 AI’의 제작에 혁신적 음성 합성 모델을 사용한다. 아이엠 AI는 산업 전반을 재편하는 세계적 혁신을 소개하는 비디오 시리즈다. 얼마 전까지만 해도 해당 영상의 내레이션은 사람이