
피지컬 AI(Physical AI)를 둘러싼 글로벌 패권 경쟁이 모델의 거대화와 데이터 확보전을 넘어서는 양상이다. 이제는 ‘실행의 완결성’이라는 현실적인 문제를 해결하는 데 집중하는 모양새다.
이렇게 뜨거운 감자로 올라선 피지컬 AI는 가상 환의 지능이 로봇·장비 등 물리적 실체에 이식된 형태를 말한다. 즉 인공지능(AI)이 상황을 인식하고 판단하는 ‘뇌’라면, 피지컬 AI는 그 판단을 근육과 관절의 움직임으로 바꿔 실질적인 행동을 수행하는 ‘신체’를 가진 AI다.
이 기술이 제조업의 판도를 바꿀 핵심으로 꼽히는 이유는 ‘자율화(Autonomous)’를 구현하기 때문이다. 기존 로봇이 정해진 궤적만 반복했다면, 피지컬 AI는 스스로 상황을 파악해 최적의 동작을 결정한다.
하지만 이 차세대 지능이 산업 현장에서 가치를 인정받기 위해서는 치명적인 전제 조건이 붙는다. 바로 ‘신뢰성’이다. 가상 및 시뮬레이션 환경에서 백발백중이던 AI 기반 로봇이 실제 공장 라인에 투입되는 순간, 미세한 진동과 엇박자를 내며 멈춰 서는 장면은 더 이상 낯선 풍경이 아니다.
현시점 모든 산업 현장이 원하는 AI의 가치는 모터와 축이 그 결정을 얼마나 ‘제때’, ‘일관된 품질로’ 실행하느냐에 달려 있다. 실제로 고속·고정밀 공정에서는 0.1초 수준의 지연(Latency)이나 1mm 내외의 궤적 오차도 충돌 회피 실패, 정밀도 저하, 라인 정지 같은 리스크로 번질 수 있다. 지능이 아무리 진화해도, 이를 물리 시스템에서 ‘반복 가능한 동작’으로 만들 제어 구조가 약하면, 피지컬 AI는 파일럿·데모에서 운영 가능한 자동화로 확장되기 어렵다.
모벤시스 양부호 의장은 이 관점에서의 해결책을 제시했다. 그는 “인간조차도 아무리 뛰어난 두뇌를 가져도 신경계가 부실하면 몸치가 될 수밖에 없다”며, 앞선 한계를 ‘시뮬레이션·실환경 간 격차(Sim2Real Gap)’로 정의했다.
이를 해결할 핵심 열쇠로 기존 하드웨어의 틀을 깨는 컴퓨팅 인프라를 제시했다. 이는 산업용 PC에서 가동하는 소프트웨어 기반 ‘실시간 모션 제어 아키텍처’다. 이제 피지컬 AI의 승부처는 지능의 명령을 물리적 실체로 변환하는 제어 구조의 혁신으로 옮겨가고 있다는 것이 그의 핵심 메시지다.
현실의 벽은 '데이터 지연'에서 시작된다...0.1초가 만드는 연쇄적 오차
Sim2Real Gap은 흔히 현실 속 변수에 의해 발생한다고 느끼기 쉽다. 하지만 엔지니어링 관점에서 이 문제를 들여다보면, 기계가 멈춰 서는 지점은 ‘데이터가 흐르는 시간’과 ‘기계가 움직이는 시간’의 충돌로 요약된다.
양 의장은 이에 대해 “현실이 단순히 지저분한 것이 아니라, 제어 시스템이 감당하지 못하는 미세 오차들이 연쇄적으로 누적돼 임계치를 넘어서는 것이 본질”이라고 짚었다.
실제로 이러한 간극을 만드는 요인은 한두 개의 돌발 변수가 아니다. 데이터가 전송되고 처리되는 과정마다 발생하는 '미세한 지연'의 총합이다. 구체적으로는 다음의 여러 경로에서 오차가 눈덩이처럼 불어난다. 마찰력, 질량 분포, 관성 등 물리 모델링의 오차는 기본이다.
여기에 센서·구동부(Actuator) 등에서 발생하는 다양한 현상이 간극을 넓힌다. 센서 데이터가 미세하게 떨리는 ‘노이즈(Noise)’부터 시간이 갈수록 열기에 의해 영점이 틀어지는 ‘드리프트(Drift)’까지 다양하다. 이러한 요소로 인해서 가상 환에서 구현한 궤적은 현실에서 길을 잃고 만다.
여기에 통신 지연, 제어 주기 불일치, 컴퓨팅 운영체제(OS) 스케줄링 간섭 등 시스템 지연이 더해지면, 시뮬레이션에서 매끄럽던 움직임도 실제에서는 진동이나 동기화 붕괴처럼 품질 저하로 나타난다.
양부호 의장은 이때의 진정한 문제는 이 결과가 흔들리는 방식이 매우 일관되게 나타난다는 점이라고 꼽았다. 예외 상황에서 AI가 판단을 멈추거나 오작동하는 사례가 대표적이다. 시뮬레이션에서는 규격화된 물체와 깨끗한 배경이 전제되지만, 실제 현장에서는 조명 변화, 먼지, 변형된 물체 등 훈련 데이터 분포를 벗어나는 요소들이 수시로 변수를 만든다.
양 의장은 “데이터 분포를 벗어난 상황에서 AI의 추론과 실제 명령 전달 사이의 타이밍이 0.1초라도 어긋나면, 고속 픽앤플레이스(Pick & Place) 같은 정밀 작업의 수율은 순식간에 바닥을 친다”고 설명했다.
결국 Sim2Real Gap은 AI 모델의 수준을 드러내는 문제가 아니다. 실행 체계가 약속된 품질, 즉 움직임을 유지하지 못한다는 뜻이다. 양 의장은 현실을 디지털 세계로 100% 복제하는 것이 불가능에 가깝다면, 유일한 돌파구는 현장에서 들어오는 피드백을 극한의 속도로 처리해 오차를 즉각 수정하는 것이라고 답했다. “결국 간극을 줄이는 싸움은 AI의 영역을 넘어 제어의 영역으로 내려올 수밖에 없다”고 그가 분석했다.
아무리 똑똑한 뇌도 '0.5ms의 근육' 없이는 춤출 수 없는 이유
이러한 피지컬 AI의 구조적 모순을 이해하는 가장 빠른 방법은 ‘시간의 단위’를 대조해보는 것이다. 모벤시스가 정의하는 피지컬 AI는 인지(Perception)·추론(Reasoning)·실행(Action)이라는 세 개의 톱니바퀴로 구성된다. 최근 여러 로봇 파운데이션 모델(RFM)이 인지와 추론 영역에서 눈부신 성과를 거두고 있음에도 불구하고, 실제 산업 현장에서 상용화가 더딘 배경으로 ‘실행 체계의 실시간성’이 꼽힌다.
양 의장에 따르면, 통상적으로 고도의 판단을 내리는 AI 모델의 연산 주기는 100~500밀리초(ms) 수준이다. 반면 로봇의 관절이 진동 없이 부드럽게 움직이기 위한 모션 제어의 주기는 반드시 0.5~1ms 단위를 지켜야 한다. 이때 ms는 1000분의 1초를 뜻한다.
그는 이 시간적 격차를 지적하며 “AI가 0.1초에 한 번 어디로 갈지 방향을 정하는 동안, 하부의 제어 시스템은 최소 수백 번 이상 모터를 어떤 곡선으로, 얼마만큼 돌릴지 업데이트해야 한다”고 강조한다. 이 간극이 벌어지면 판단이 훌륭해도 실행이 뒤처지고, 실행이 뒤처지면 동기화가 깨지며 전체 시스템의 신뢰도가 무너진다고 덧붙였다.
양 의장은 이 지연의 주요 원인으로 하드웨어 기반의 ‘프로그래밍 가능 로직 제어기(PLC)’ 아키텍처를 지목한다.
“가상 환경에서는 PLC와 같은 외부 제어 단계 및 중간 과정을 거치지 않습니다. 그렇기 때문에 실행 지연이 겉으로 드러나지 않는 맹점이 있는데요. AI 추론 결과는 필수적으로 제어 단계와 통신 경로 등 여러 과정을 거쳐 전달되기 때문에 누적 지연이 발생하는 결과를 낳습니다”
이러한 그의 주장은 상위 시스템에서 아무리 실시간으로 상황을 인식해도, 마지막 실행 단계에서 외부 제어기로 명령이 빠져나가며 발생하는 지체 시간 때문에 빠른 동작은 불가능해진다는 것을 시사한다.
결국 로봇이 느릿하게 움직일 때만 그럴듯하게 보이는 ‘데모용 기술’에 머물게 된다는 메시지다. 이는 피지컬 AI의 병목이 지능 모델이 아니라, 명령을 전달하는 실행 구조라는 주장에 힘이 실리는 대목이다.
단순 반복을 넘어 AI와 실시간으로 소통하는 ‘지능형 중추’
PLC는 아주 오랫동안 산업·공장 자동화(FA) ‘철칙’이었다. 정해진 절차(Sequence)를 안정적으로 반복하고, 설비를 안전하게 멈추며, 유지보수 관점에서도 익숙한 구조를 제공해왔기 때문이다. 대다수 제조 공정은 이 PLC를 중심축으로 설계돼 왔다. 그 덕분에 전 세계 공장은 예측 가능한 방식으로 가동될 수 있었다.
양 의장은 그러나 피지컬 AI와 결합되는 순간, PLC에 요구되는 조건은 완전히 달라진다고 짚었다. 로봇·기계의 눈인 비전(Vision) 센서에서 쏟아지는 방대한 시각 데이터를 실시간으로 처리해야 함은 물론, AI가 내린 판단을 로봇에게 전달하는 다양한 '중개 소프트웨어(Middleware)'와의 복잡한 연결 과정도 거쳐야 한다는 시각이다.
여기에 AI가 상황을 분석하고 판단하는 시간(AI Runtime) 내내 끊임없이 기계와 데이터를 주고받는 과정이 필수적이다. 이처럼 현시점의 제어는 단순히 명령을 받아 기계를 움직이기만 하는 스위치 역할에 머물러선 안 된다는 의미다.
양 의장은 기존 하드웨어 PLC를 두고 ‘기능이 닫혀 있는 블랙박스’라는 정의를 내렸다. 그는 “기존 방식은 제조사가 허용한 기능만 활용할 수 있다. 하지만 AI와 데이터의 시대에는 현장에서 직접 데이터를 수집하고 PC 자원을 활용해 직접 제어 알고리즘을 개발하려는 수요가 폭발하고 있다”고 분석했다.
양 의장의 관점대로라면, 제어 시스템이 폐쇄적일수록 피지컬 AI의 진화 속도는 발목을 잡힐 수밖에 없다. 그의 주장은 기존 PLC의 가치를 부정하는 것이 아니다. 다만 피지컬 AI 시대의 제어기가 단순히 기계 뒷단에 탑재된 ‘제어 상자’에 머물 것인지, 아니면 AI와 유동적으로 호흡하는 ‘유연한 소프트웨어 체계’로 거듭날 것인지로 연결된다. 차세대 제어기의 가치는 얼마나 소프트웨어적으로 유연하게 AI의 지능을 소화할 수 있느냐로 결정된다는 뜻이다.
하드웨어 종속성 탈피, 본질은 제어 아키텍처의 근본적 재설계
일부에서는 소프트웨어 기반 제어기를 그저 ‘비싼 전용 장비(PLC)를 값싼 공용 컴퓨터(PC)로 바꿔 비용을 아끼는 도구’ 정도로만 여기기도 한다. 양부호 의장에 따르면 이는 본질을 놓친 해석이다. 모벤시스가 지향하는 핵심은 하드웨어 종속성을 완전히 걷어내고 제어 아키텍처를 근본적으로 재설계하는 데 있다.
PC의 강력한 연산 자원을 활용해 고성능 모션 제어를 소프트웨어로 구현함으로써, 로봇·기계의 축(Axis) 수가 늘어나거나 통신 방식이 바뀌어도 하드웨어 추가 없이 대응할 수 있는 유연성을 확보하는 것이 본질이다.
이러한 접근법에서 모벤시스의 소프트웨어 기반 모션 제어 플랫폼 ‘WMX’는 AI의 두뇌와 로봇·기계의 근육을 실시간으로 잇는 최적의 연결 고리가 된다. WMX는 기존에 수많은 제어 보드와 복잡한 배선이 필요했던 구성을 하나의 산업용 PC(IPC) 중심으로 통합하는 설계를 제시한다.
모벤시스가 WMX로 강조하는 것은 AI가 만든 동작을 현장 제어 주기에 맞춰 안정적으로 실행시키는 소프트웨어 체계라는 점이다. 제어 로직을 폐쇄적으로 가두는 대신, 산업용 PC 내부에서 모션 제어, 통신, 확장 로직을 한데 묶어 AI·비전·데이터와의 연결 단계를 줄이겠다는 설계다. 결국 WMX의 차별점은 AI의 판단을 고속·정밀 공정에서도 흔들리지 않게 반복시키는 실행 구조에 있다.
양 의장은 “우리는 WMX와 같은 기술을 ‘소프트 모션(Soft Motion)’ 기술로 정의한다. 최대 128축의 정밀 동기 제어를 단일 중앙처리장치(CPU)에서 소프트웨어적으로 처리한다”며 아키텍처의 작동 원리를 설명했다.
그러면서 “기존에는 로봇·기계를 정밀 제어하는 C/C++ 계열 언어와 AI 개발에 주로 쓰이는 파이썬(Python) 등의 언어 체계가 서로 달라 이를 통합하기가 매우 까다로웠다”며 이전의 기술적 한계를 지목했다.
이어 WMX 플랫폼은 C, C#, 파이썬 등 현장의 다양한 프로그래밍 언어를 모두 수용한다며, “이를 통해 AI가 생성한 동작 결과를 실시간 제어 주기에 최적화해 실행 단계에서 구현할 수 있는 환경이 열릴 것”이라고 강조했다. 현대적인 언어로 기능을 무한히 확장하는 WMX와 같은 오픈 아키텍처야말로 피지컬 AI를 위한 최적의 토양이라는 설명도 덧붙였다.
그가 이 지점에서 역설한 기술적 성취는 윈도우(Windows)와 같은 범용 OS 환경에서도 실시간 실행이 흔들리지 않도록 설계된 시스템의 안정성이다. 제어에 필요한 연산과 통신이 다른 OS 작업에 밀리지 않도록 자원을 물리적으로 분리하고, 궤적 생성과 동기화가 0.5ms 주기로 반복 가능한 품질을 유지하도록 만드는 것이 핵심이다.
양 의장은 “실시간성을 하드웨어의 타고난 성질로만 두지 않고, 소프트웨어의 설계 능력으로 확보하려는 시도”라고 WMX의 정체성을 정의했다.
실패에서 배우는 로봇·기계...‘스스로 진화하는 순환 고리’
모벤시스가 Sim2Real Gap을 극복하겠다고 할 때, 그 핵심은 오차를 끊임없이 수정하는 ‘피드백 루프(Feedback Loop)’를 완성하는 데 있다. 가상 환경에서 아무리 정교하게 훈련해도 실제 현장의 돌발 상황을 모두 예측할 수는 없기 때문이다. 시스템 지연을 최소화하고 고속 센서 피드백을 실시간으로 반영해, 오차가 발생한 즉시 이를 상쇄하는 구조를 만드는 것이 유일한 해법이라는 것이 사측의 관점이다.
양 의장은 이 철학을 ‘가상에서 키우고, 현실에서 단련한다(Raise in the virtual, forge in the real)’는 슬로건으로 요약했다. 시뮬레이션에서 동작의 뼈대를 만들고, 실제 구동 과정에서 발생하는 오차와 실패 데이터를 다시 모델로 환류시켜 로직을 조정하는 루프를 정립하는 방식이다.
결국 피지컬 AI가 산업 현장에서 실질적인 가치를 증명하려면 이 루프의 회전 속도가 빨라야 한다. 루프를 가동할 때마다 결과의 편차가 눈에 띄게 줄어드는 ‘즉각적인 진화’가 필요하기 때문이다.
모벤시스가 제시하는 데모 시나리오는 이 구조를 명확히 입증한다. 예를 들어 AI 비전이 컨베이어 위 부품을 인식함과 동시에, WMX는 0.5~1ms라는 짧은 주기로 로봇의 실시간 궤적을 생성한다. 이 찰나의 순간에 발생하는 모든 미세 오차 데이터는 곧장 AI 모델로 피드백되며, 이는 현장 맞춤형 학습인 ‘파인튜닝(Fine-Tuning)'의 재료가 된다.
결국 핵심은 지능과 실행이 분리된 것이 아니라, 현장 데이터가 지능을 실시간으로 다시 고도화하는 ‘폐루프(Closed Loop)’ 시스템에 있다. 양부호 의장은 실행에서 얻은 생생한 피드백이 모델을 끊임없이 진화시키는 이 구조야말로 피지컬 AI의 성능을 결정짓는 진정한 경쟁력이라고 목소리를 높였다. 가상에서 키운 지능이 현실의 시련을 거치며 완성형으로 거듭나는 인프라, 그것이 바로 WMX가 지향하는 정밀 제어의 미래라는 뜻이다.
의장에게 묻다 "왜 지금 소프트웨어 제어인가"
Q. Sim2Real Gap 극복이 결국 ‘제어 최적화’라는 전통적 과제로 회귀하는 것 아닌가.
A. 회귀가 아니라 우선순위의 재정립이다. 물리 모델의 오차와 시스템 지연이 중첩될 때, 제어단에서 촘촘하게 동기화를 잡아주면 모델의 계획이 현실에서 무너질 확률은 비약적으로 낮아진다. 이는 AI 모델의 성능을 폄훼하는 것이 아니다. 지능이 설계한 행동을 현장에서 ‘반복 가능하게’ 구현할 수 있는 기초 체력이 선행되어야 한다는 의미다.
Q. 기존 하드웨어 기반 PLC를 ‘블랙박스’에 비유했다. 폐쇄적인 구조가 걸림돌이라는 의미인가.
A. PLC가 지난 수십 년간 공장 자동화의 표준으로서 기여한 공로는 부정할 수 없다. 다만 피지컬 AI 시대에는 제어 로직이 하드웨어라는 박스 안에 갇혀 있을 경우, 개선 속도가 기술 혁신을 따라가지 못하는 병목 현상이 발생한다. 제어 과정과 데이터에 직접 접근해 실시간 튜닝을 원하는 개발자들에게, 소프트웨어 기반의 오픈 아키텍처는 이제 선택이 아닌 필수적인 대안이다.
Q. 소프트웨어 방식이 하드웨어보다 지연(Latency)에 유리하다는 기술적 근거는?
A. 지연은 보통 데이터가 거치는 ‘중간 정거장’이 많을수록 심해진다. 명령이 AI에서 나와 외부 제어기와 통신망을 거쳐 로봇·기계까지 전달되고, 다시 그 결과가 돌아오는 과정에서 시간이 조금씩 낭비되기 때문이다. 우리가 고안한 소프트웨어 방식은 이 복잡한 정거장들을 없애고, 제어 시스템을 산업용 컴퓨터(PC) 내부에서 더 가깝게 통합하려는 시도다. 즉 전달 경로를 단순화해 명령이 로봇·기계까지 닿는 시간을 줄이고, 동기화가 흔들릴 여지를 낮추겠다는 의미다. 여기에 이더캣(EtherCAT) 같은 고속 통신이 더해지면, 지연 수준이 ‘관리 가능한 범위’로 내려오고, 고속·정밀 작업에서 반복 품질을 확보할 여지가 커진다.
Q. 보수적인 제조 현장에 소프트웨어 제어 방식이 즉각 확산될 수 있겠나.
A. 모든 설비를 당장 교체할 수는 없다. 하지만 제어 축 수가 늘어나고 통신 구조가 복잡해지며, AI와 제어가 한 몸처럼 엮여야 하는 고난도 정밀 공정이라면 이야기가 다르다. 특히 고정밀과 고속이 동시에 요구되는 첨단 산업 구간에서는 제어를 소프트웨어 스택으로 다루는 역량이 기업의 실질적인 경쟁력을 결정짓게 될 것이다.
피지컬 AI의 마지막 퍼즐...“정답을 맞히는 능력보다 '반복시키는 능력'이 대세”
피지컬 AI를 논할 때 여전히 모델의 이름과 파라미터 수에 집중하는 경향이 있다. 하지만 산업 현장은 훨씬 더 명확한 기준을 요구한다. 바로 ‘반복 가능성(Repeatability)’이다. 같은 조건에서 백 번을 돌려도 똑같은 결과를 내야 하고, 예상치 못한 변수가 끼어들어도 결과의 편차를 관리 범위 안으로 묶어둬야 한다. 그 반복 가능성을 담보하는 곳에서 소프트웨어 기반 실시간 모션 제어 기술 체계의 중요성이 필연적으로 다시 힘을 얻는다.
모벤시스가 시장에 던지는 메시지는 결국, 피지컬 AI는 결코 ‘두뇌’만으로 완성되지 않는다는 것이다. 두뇌가 내린 고차원적인 결정을 몸이 제때, 그리고 정확히 실행할 수 있어야 비로소 지능은 가치를 갖는다는 의미다.
Sim2Real Gap을 줄이는 싸움은 이제 모델의 화려함보다 실행 구조의 단단함을 먼저 묻는 싸움이 됐다. 그리고 이 실행 구조를 누가 더 빠르게 확장하고, 더 쉽게 통합하며, 더 예측 가능한 품질로 제공하느냐가 피지컬 AI 다음 라운드의 승부처가 될 것으로 보인다. 피지컬 AI의 성패는 ‘정답을 맞히는 능력’에서, ‘정답을 현장에서 반복시키는 능력’으로 이동하고 있다.
헬로티 최재규 기자 |





