인공지능 음성 에이전트 개발 플랫폼 보이스런(VoiceRun)이 엔터프라이즈 개발자를 겨냥한 ‘음성 에이전트 공장’ 구축을 목표로 시드 투자를 유치했다.
미국 IT 매체 테크크런치(TechCrunch)에 따르면 보이스런 공동창업자인 니컬러스 레너드(Nicholas Leonard) 최고경영자와 데릭 카네야(Derek Caneja) 최고기술책임자는 인공지능 음성 에이전트를 만들려고 했지만, 당시 시장에 나와 있던 다수의 음성 에이전트 도구에서 설계상의 결함을 느꼈다고 밝혔다.
레너드 최고경영자에 따르면 일부 음성 에이전트는 노코드(no-code) 도구로 개발돼 제품을 빠르게 출시할 수 있지만, 제품 품질이 낮은 경우가 많았다. 또 다른 음성 에이전트는 대형 기업이 수개월 동안 특화된 도구를 개발할 수 있는 시간과 자원을 투입해 만든 것으로, 일반 개발자나 기업이 활용하기에는 한계가 있었다고 설명했다.
레너드 최고경영자는 “개발자와 기업에는 대안이 필요했다”고 말하며, 그는 카네야 최고기술책임자와 함께 소프트웨어의 미래는 “코딩 에이전트에 의해 코딩되고, 검증되고, 최적화되는 것”이라는 인식을 공유했다고 전했다. 레너드 최고경영자는 이러한 두 가지 통찰과 과거에 대한 인식이 보이스런 설립의 영감이 됐다고 밝혔다.
보이스런은 지난해 개발자와 코딩 보조 도구가 음성 에이전트를 출시하고 확장할 수 있도록 하는 플랫폼으로 출범했다. 레너드 최고경영자에 따르면 당시 다수의 로코드(low-code) 플랫폼은 시각적 다이어그램을 활용해, 사용자가 대화 흐름을 클릭해 구성하고 상자에 프롬프트를 입력해 에이전트의 행동을 정하는 방식이었다.
레너드 최고경영자는 이 같은 시각적 구성 방식은 관리가 어렵다고 지적했다. 반면 보이스런은 사용자가 코드로 음성 에이전트의 행동을 정의할 수 있도록 해, 원하는 제품을 보다 유연하게 만들 수 있게 하는 것이 특징이라고 설명했다.
레너드 최고경영자는 코드가 코딩 에이전트의 모국어라고 표현하며, 이들이 시각적 인터페이스보다 코드 환경에서 훨씬 더 잘 작동할 것이라고 말했다. 그는 시각적 인터페이스에서는 구성 옵션이 제한돼 있어, 예를 들어 다른 방언으로 말하는 음성 에이전트를 만들고자 할 때 인터페이스 제작자가 해당 기능을 지원하지 않으면 구현이 어렵다고 지적했다.
이에 대해 레너드 최고경영자는 “코드에서는 그런 작업이 놀라울 정도로 간단하다”고 말했다. 또 “시각적 인터페이스에서 지원되지 않는, 사용자가 원하는 작은 기능들의 예시는 수백만 개에 달하는 긴 꼬리(long tail)를 이룬다”고 덧붙였다.
보이스런은 코딩 에이전트 기능 외에도 A/B 테스트를 수행하고 원클릭으로 즉시 배포할 수 있는 기능을 제공한다. 이 회사는 엔터프라이즈 개발자를 주요 대상으로 삼고 있으며, 예를 들어 기업이 고객 서비스에 인공지능을 도입하거나 기술 기업이 음성 기반 제품을 출시하는 데 도움을 주는 것을 목표로 하고 있다.
레너드 최고경영자는 자사가 한 음식점 기술 기업과 협력해 음식 예약을 위한 인공지능 전화 컨시어지 서비스를 출시하는 작업을 진행하고 있다고 밝혔다. 그는 이 같은 사례를 통해 보이스런이 기업 고객을 지원하고 있다고 설명했다.
보이스런은 1월 14일(현지 시간) 550만달러 규모의 시드 라운드 투자를 마무리했다고 발표했다. 이번 투자 라운드는 플라이브리지 캐피털(Flybridge Capital)이 주도했다고 테크크런치는 전했다.
테크크런치는 인공지능 에이전트 영역에서 경쟁이 치열하다고 보도했다. 보도에 따르면 관련 스타트업들은 지난해 인공지능 기업 전반에 유입된 다수의 자금 가운데 수십억달러를 확보했다.
레너드 최고경영자는 자사가 시장의 양극단과 경쟁하고 있다고 평가했다. 그는 한쪽 끝에는 블랜드(Bland), 리텔 에이아이(Retell AI)와 같이 사용자가 빠르게 데모를 만들 수 있게 해주는 노코드 음성 빌더들이 있고, 다른 한쪽에는 개발자에게 최대한의 통제권을 제공하는 라이브키트(LiveKit), 파이프캣(Pipecat)과 같은 고급 도구들이 있다고 설명했다.
레너드 최고경영자는 보이스런이 이 두 시장 사이의 중간 지점에 위치한다고 말했다. 그는 “우리는 글로벌 음성 인프라와 평가 기반 라이프사이클을 제공하면서, 비즈니스 로직 코드와 데이터를 고객 손에 남겨둔다”고 밝혔다.
또 그는 “핵심적인 차별점은 에이전드 투 에이전드(end-to-end) 코딩 에이전트 개발의 선순환을 닫고 있다는 점”이라며, 개발자들이 코드를 작성하고, 테스트를 실행하고, 배포하고, 개선 사항을 제안하는 코딩 에이전트를 감독하게 될 것으로 예상한다고 말했다.
레너드 최고경영자는 한편으로 자신의 제품이 개발자들이 더 나은 음성 에이전트 도구를 만들도록 도와, 사람들이 자동응답 음성에 더 편안함을 느끼도록 하는 데 기여하길 바란다고 밝혔다. 그는 현재 고객들은 전화를 걸었을 때 사람이 받으면 “안도감”을 느끼는데, 이는 음성 자동화가 그동안 취약하고 비효율적이었기 때문이라고 말했다.
테크크런치는 고객 서비스와 관련해 여전히 사람이 응대하는 것을 선호하는 경향이 강하다고 전했다. 보도에 따르면 지난해 파이브나인(Five9)이 실시한 한 설문조사에서는 응답자의 4분의 3이 고객 서비스 문제에 대해서는 사람과 이야기하는 것을 선호한다고 답했다.
레너드 최고경영자는 인간 상담사도 언어 장벽이나 이용자에게 판단받는 느낌을 주는 등 한계를 지니고 있다고 지적하며, 이러한 인식을 바꾸고 싶다고 밝혔다. 그는 자동차 산업을 비유로 들며 “모델 T 이전에도 훌륭한 자동차는 있었지만, 조립 라인이 도입되기 전에는 차량이 보편화되지 않았다”고 말했다.
레너드 최고경영자는 “오늘날에도 훌륭한 음성 에이전트가 있지만, 음성 에이전트 공장이 구축되기 전에는 이들이 보편화되지 않을 것”이라며 “보이스런이 바로 그 공장”이라고 강조했다.
헬로티 |













































