멀티미디어 콘텐츠를 높은 정확성과 효율성으로 이해 및 분석하는 것 가능해져 알리바바 클라우드가 대규모 언어 모델(LLM)인 ‘통이치엔원(Tongyi Qianwen)’을 AI 구동 미팅 어시스턴트인 ‘팅우(Tingwu)’와 결합했다고 2일 발표했다. 통이치엔원은 알리바바 클라우드가 최근 공개한 대규모 언어 모델이며, 이를 팅우에 결합해 멀티미디어 콘텐츠를 높은 정확성과 효율성으로 이해하고 분석하는 것이 가능해졌다. 가령, 비디오 또는 오디오 파일에서 내용이 요약된 텍스트를 생성하거나 각 화자의 주요 요점을 정리해준다. 또한, 멀티미디어 파일의 타임라인을 생성하거나 섹션별 요약본을 개발한다. 알리바바 클라우드는 이 대규모 언어 모델을 기반으로 한 팅우를 ‘통이 팅우(Tongyi Tingwu)’라 명명하고 현재 베타 테스트 중이다. 통이 팅우는 알리바바의 디지털 협업 업무 공간이자 애플리케이션 개발 플랫폼인 ‘딩톡(DingTalk)’에도 적용돼 업무 간 필요한 AI 서비스를 제공할 예정이다. 통이팅우는 업무 효율성을 개선하는 것 외 다양한 멀티미디어 플랫폼에서 온라인 교육, 트레이닝, 인터뷰, 라이브 스트리밍, 팟캐스트, 숏폼 비디오 등에 활용되며 더욱 빠르고 쉬
헬로티 서재창 기자 | 알리바바그룹의 디지털 기술 및 데이터 인텔리전스 중추인 알리바바 클라우드는 AI 구동 미팅 어시스턴트인 '팅우(Tingwu)'와 클라우드 '컴퓨터 우잉(Wuying)'의 최신 버전을 지난 21일 공개했다. 이 솔루션은 새로운 업무 환경에 따른 맞춤형 제품으로, 팬데믹으로 가속화되는 업무 자동화 및 원격 근무를 진행하는 기업에 적합하다. 팅우는 알리바바그룹의 글로벌 연구 기관 다모(DAMO) 아카데미의 스피치 랩이 개발한 AI 구동 미팅 어시스턴트다. 팅우는 구두 회의 내용을 서면 회의록으로 실시간 변환한다. 즈지에 옌(Zhijie Yan) 알리바바 다모 아카데미 스피치 랩 대표는 “팅우는 알리바바의 종단형 음성 인식 솔루션이 탑재돼 있어 원격근무가 많은 기업의 회의와 인터뷰에 완벽한 툴이다. 팅우의 자동 음성 텍스트 변환 기능으로 비즈니스 회의가 혁신적으로 변화할 것”이라고 밝혔다. 올해 압사라 콘퍼런스(Apsara Conference)에서 공개된 팅우는 다모 아카데미가 독자 개발한 성문 및 음성 방위각 분석 알고리즘을 사용해 최대 10명의 목소리를 구별하며 스마트 마이크를 탑재해 주변 소음을 줄이면서도 10미터 이내의 음성을 쉽게 수