[기획연재] ‘로봇 비전’ 기술의 하드웨어와 소프트웨어

URL복사

사람은 ‘눈이 아니라 뇌로 본다’는 말이 있다. 우리의 뇌는 시각·청각·촉각·미각·후각 등 감각 기관에서 들어온 정보를 뇌에서 해석하여 세상을 이해한다. 특히 우리 뇌의 상당부분은 감각기관을 통해서 획득하는 정보의 80% 이상을 차지하는 시각 정보를 해석하는데 사용된다. 그래서 우리가 매일 인지하는 세계는 시각 정보가 ‘모사’된 세계가 아니라 우리 뇌가 ‘해석’한 세계이다.

로봇도 마찬가지이다. 특히 스마트 팩토리에서 다양한 작업물을 다루어야 하는 로봇이 주변 환경과 사물을 스스로 인식할 수 있는 ‘시각 지능’을 갖추어야 하며 이를 ‘로봇 비전’ 기술이라고 한다. ‘로봇 비전’은 사람의 ‘눈’에 해당하는 하드웨어인 ‘카메라’ 기술과 카메라로 들어온 시각 정보를 해석하는 ‘비전 소프트웨어’ 기술로 나눌 수 있다. 이번 편에서는 ‘카메라’의 핵심 원리와 작동 방식 및 종류에 대해 먼저 알아보고 다음 편에서는 로봇 전용 비전 소프트웨어에 대해 기술하려고 한다.

카메라의 핵심 원리

‘로봇 비전’에서 사용하는 카메라는 크게 2D와 3D로 나눌 수 있다. 2D 카메라는 우리가 일반적으로 사용하는 핸드폰 카메라나 웹카메라 등과 같이 촬영한 3D 공간상의 피사체를 2D 평면에 투사하여 각 픽셀당 RGB 삼색정보로 표현된 2D 이미지 정보를 추출한다. 이에 반해 3D 카메라는 3D 공간상의 피사체를 3D 공간상의 점들의 집합인 포인트클라우드(point cloud)로 추출하고, 각 3D 포인트에는 RGB 색정보도 같이 담겨있어서 그림 1과 같이 3D 공간상의 실제 피사체의 형상과 색상을 그대로 추출할 수 있다.

먼저 3D 카메라는 RGB 이미지와 유사하게 각 실제 3D 공간상의 피사체가 투사된 2D 평면의 각 픽셀당 거리값에 해당하는 거리 이미지(depth image)를 추출할 수 있어야 한다. 그다음에 실제 3D 공간상의 피사체가 거리 이미지로 만들어지는 핀-홀 원리를 거꾸로 응용하면 3D 공간상에 포인트 클라우드를 계산으로 얻어낼 수 있는데, 이는 실제 피사체에 카메라로부터 특정 광선을 투사하여 실제 피사체를 샘플링한 점들의 집합으로 ‘모사’한 것이라고 할 수 있다(그림 2).

3D 카메라 종류와 동작 원리

3D 카메라는 거리 이미지를 측정하는 원리에 따라 종류가 다양하다. 그림 3은 현재 시중에 나와 있는 대표적인 3D 카메라로 대표적인 네 가지 동작 원리를 간단히 설명하면 다음과 같다.

먼저 스테레오(Stereo) 방식은 사람의 눈이 두 개인 것처럼 일정 거리만큼 떨어진 2D 카메라 두 개를 사용하면 가까운 물체는 더 크게 보이고 먼 물체는 더 작게 보이는 원리를 이용한다. 두 카메라 이미지에서 동일한 지점의 위치를 찾을 수 있으면 수평 거리차를 이용하여 그 지점에 대한 수직 거리를 삼각 측정법으로 계산할 수 있다. 이 방식은 특징점이 분명하지 않은 피사체인 경우는 동일지점을 찾기가 어렵다는 단점이 있는데, 이를 극복하기 위해 Active IR Stereo 방식은 눈에는 보이지 않은 특정 적외선(IR) 패턴을 피사체에 투사하여 인위적인 특징 점들을 만들어낸다. 이 패턴을 기반으로 두 개의 적외선 카메라가 스테레오 방식으로 거리 이미지를 생성하고 또 다른 RGB 카메라에서 읽은 RGB 이미지로 색상정보를 입힌 포인트 클라우드를 생성한다.

또 다른 방식으로 Time of Flight 카메라가 있다. 이 3D 카메라는 빛이 반사 표면을 오가는 데 걸리는 시간 측정을 기반으로 한다. 카메라가 특정 주파수의 광 펄스 또는 펄스 스트림을 보내고 피사체의 표면에서 반사되어 센서의 픽셀에서 다시 감지될 때까지의 시간 지연을 측정하여 정확한 거리값을 계산하고 거리 이미지를 생성한다. 이 카메라는 값이 저렴하고 카메라의 크기가 작다는 장점이 있지만, 다른 방식에 비해서 거리 이미지의 신호 대 잡음비(signal-to-noise) 비율이 상대적으로 낮아서 높은 정확도를 요구하는 작업에는 적절하지 않다.

로봇 비전을 이용한 작업 중 가장 높은 정확도를 요구하는 메니퓰레이터에는 구조광(Structured light) 방식의 3D 카메라가 가장 우수한 성능을 보인다. 이 방식은 가시광선 영역의 구조화된 패턴광(사인파, 무지개 패턴, 그리드 인덱싱, 컬러 스트라이프 인덱싱 등)을 광프로젝터를 사용하여 피사체에 투사하고, 프로젝터와 다른 관점에서 패턴을 볼 때 패턴이 거리에 따라 왜곡된 방향과 크기를 측정하여 거리를 계산한다. 또한, 프로젝터의 밝기·강도 및 카메라의 조리개·노출시간과 다양한 패턴을 결합하는 HDR(High Dynamic Range) 방식으로 다양한 색상 및 표면 재질을 가진 피사체에 최적화할 수 있는 다양한 설정을 지원한다.

그림 4. 로봇 비전을 이용한 작업 중 가장 높은 정확도를 요구하는 메니퓰레이터에는 구조광 방식과 HDR 방식으로 피사체에 최적화할 수 있는 다양한 설정을 지원한다.

3D 카메라 발전과 소프트웨어 기술

최근 5년간 3D 카메라의 비약적인 발전으로 3D 카메라의 가격은 낮아진 반면 성능은 아주 많이 향상되었다. 특히 카메라의 사이즈가 작이지고 가성비에 따라 다양한 스팩의 카메라를 선택할 수 있게 되면서 다양한 로봇 어플리케이션에 적용할 수 있게 되었다. 특히 보급형 3D 카메라의 가격은 2D 카메라와 비교하여 가격차이가 크지 않기 때문에 기존에 2D 카메라로 찾을 수 없는 작업물의 거리와 각도의 틀어짐까지 보정할 수 있는 3D 카메라가 2D 카메라를 대체함을 넘어서 이전에 하지 못했던 어플리케이션으로 로봇 비전의 활용도를 빠르게 더 넓혀가고 있다.

3D 카메라 기술은 더 이상 특별한 것이 아니라 이미 널리 사용되고 있으며 많은 전문 회사에 의해 상용화되고 상품화되었다. 2D 카메라에 비해 상대적으로 높은 가격 역시 앞으로 시장이 성장하고 경쟁함에 따라 자연스럽게 더 낮아질 것으로 예상된다.

하지만 3D 카메라, 즉 하드웨어 기술만 가지고는 로봇의 ‘시각 지능’, 즉 ‘로봇 비전' 기술을 구현할 수가 없다. 더 중요한 기술은 어떤 카메라를 사용하든지 동일하게 얻어지는 실제 환경을 ‘모사’한 3D 포인트 클라우드 데이터, 즉 시각 정보를 ‘해석’하고 환경을 ‘이해’하여 로봇이 주어진 작업 동작을 ‘계획’하고 ‘실행’하게 하는 ‘로봇 비전 및 가이던스’ 소프트웨어 기술이다. 이 기술은 최근 비약적으로 발전된 인공지능(AI) 기술과 결합하여 많은 소프트웨어 솔루션이 나오고 있다. 이에 대해서는 다음 편에 더 자세히 설명하고자 한다.

에이디링크, ‘AFM’ 기술로 산업용 엣지 시스템 유연성 강화

에이디링크가 산업 현장에 최적화된 차세대 엣지 AI 플랫폼을 통해 디지털 전환 가속화에 나서고 있다. 에이디링크는 신뢰성 높은 하드웨어와 임베디드 소프트웨어를 통합한 구조로 스마트하고 안정적인 시스템을 빠르게 구현할 수 있도록 지원한다. 신재생에너지·공장 자동화·지능형 교통 등 다양한 산업 분야에서 적용 가능하며 개발 기간 단축과 운영 효율성 향상을 동시에 실현할 수 있다. 에이디링크는 Intel, NVIDIA, Arm 등 글로벌 기술 기업들과 협력해 엣지 플랫폼의 성능과 확장성을 지속적으로 강화하고 있다. 이러한 협업을 통해 이기종 컴퓨팅 기반의 맞춤형 AI 솔루션을 제공하며 CPU·GPU·FPGA·ASIC을 통합한 구조로 복잡한 연산 작업을 효율적으로 처리할 수 있다. 고객은 애플리케이션 요구사항에 최적화된 시스템을 구성하면서도 투자 대비 효과를 극대화할 수 있다. 특히 에이디링크는 독자 기술인 ‘AFM(Adaptive Function Module)’을 도입해 시스템 통합의 유연성을 높였다. I/O 확장, AI 가속 모듈, SSD, 메모리, 무선 통신 등 다양한 하드웨어를 조합해 고객 맞춤형 구성이 가능하며 산업 현장의 요구 변화에도 신속하게 대응할 수

[인더스트리 솔루션 인사이트] 로봇이 된 공장, 소프트웨어가 된 산업

공장이 움직인다. 단순한 자동화를 넘어, 공장 전체가 하나의 거대한 로봇처럼 작동하는 ‘피지컬 AI(Physical AI)’ 시대가 도래했다. 이 가운데, 공장의 하드웨어 중심 운영은 소프트웨어 기반 플랫폼으로 전환되고 있으며, 이 과정에서 맥락을 이해하는 인공지능(AI), 디지털 트윈(Digital Twin), 시뮬레이션 등 기술이 핵심 역할을 한다. 현시점 제조업은 제품 생산을 이상의 가치를 추구하고 있으며, 시스템 자체를 수출하는 산업으로 진화하는 중이다. 이번 특집은 한국과학기술원(KAIST)의 ‘소프트웨어 정의 공장(SDF)’부터 네이버 ‘인공지능(AI) 에이전트’, 다임리서치 시뮬레이션 기술, 유니티 실시간 3차원(3D) 솔루션까지 제조업 혁신의 최전선 기술 방법론을 짚는다. [특집] 로봇이 된 공장, 소프트웨어가 된 산업 [Real-time 3D] 게임 넘어 산업 현장으로…실감나는 상호작용 경험이 ‘산업 DX’ 핵심 [AI Simulation] 제조·물류 현장 ‘물리적 AI’ 시대 도래…AI 시뮬레이션으로 미래를 현실로 [Physical AI] 공장이 하나의 거대한 로봇 된다…KAIST, 피지컬 AI로 제조 혁신 선언 [AI Agent] AI 에

애로우, AI·ML 기반 자동화 워크플로로 진단 정확도 향상하다

애로우 일렉트로닉스(이하 애로우)가 의료 영상 분야에서 인공지능(AI) 활용 방안을 담은 백서를 발표했다. 이번 백서는 MRI, CT, PET 등 대용량 의료 데이터를 기반으로 한 진단 과정에서 나타나는 다양한 과제를 짚고 이를 해결하기 위한 AI·머신러닝(ML) 기반 분석 기술과 고성능 컴퓨팅 인프라 전략을 제시한다. 의료 영상 데이터는 전 세계 의료 데이터의 30% 이상을 차지하며 2025년까지 지속적으로 증가할 것으로 예상된다. 기존 진단 방식은 방사선 전문의의 경험과 수동 해석에 크게 의존했지만 데이터 복잡성과 환자 증가로 인해 한계가 뚜렷하다. 특히 초기 병변은 신호가 약하거나 대비가 낮아 탐지가 어렵고 환자 간 해부학적 다양성이나 영상 기법 차이로 인해 오진 가능성도 크다. AI와 ML은 이러한 제약을 극복할 수 있는 도구로, 다중 모달리티 데이터를 분석해 미묘한 이상을 식별하고 종양 탐지·분류·치료 반응 예측 등 진단 효율성을 높인다. 백서에 따르면 AI 통합은 기존 방사선학 워크플로를 수동 중심에서 데이터 기반 자동화 파이프라인으로 전환한다. 이미지 수집 이후 GPU·AI 가속기를 활용한 병렬 처리와 NVMe SSD 기반 저장 장치, 고대역폭

경전기차(LEV)의 설계 혁신, 모듈형 파워트레인이 이끈다

지속가능한 미래 모빌리티의 핵심, 경전기차(LEV)의 성장세가 눈부시다. 글로벌 전기차 시장이 2024년 1조3280억 달러 규모에 도달하며, 이 중 LEV는 도심 통근 및 개인 이동 수단으로 빠르게 확산되고 있다. 이 전자책은 바로 이러한 흐름 속에서, 모듈형 파워트레인 설계를 중심으로 한 LEV 기술과 전략을 종합적으로 다루고 있다. 애로우 일렉트로닉스는 eBook을 통해 설계자와 제조사, 시스템 통합자들이 직면한 에너지 밀도 최적화, 열관리, 확장성, 규제 대응 등 핵심 과제를 제시하고, 이를 해결하기 위한 트랙션 인버터, HMI, ADAS, TPMS, 온보드 충전기 등 주요 하위 시스템별 설계 인사이트를 제공한다. 특히 Melexis, ST, Infineon, NXP, Analog Devices 등 주요 반도체·센서 업체들의 솔루션이 체계적으로 소개돼, 제품 선택에 실질적인 가이드가 된다. 주목할 점은, AI 기반 예측 유지보수, 디지털 트윈, 배터리 교체 기술 등 LEV의 미래까지 폭넓게 조망한다는 것이다. 단순한 부품 나열을 넘어, 확장 가능하고 유연한 모듈식 설계의 전략적 가치를 강조하며, 고속 충전·스마트 커넥티비티·자율주행 요소까지 아우르는

애로우, 고성능 LEV 인버터 설계로 모빌리티 전환 가속하다

애로우 일렉트로닉스(이하 애로우)가 소형 전기차(LEV: Light Electric Vehicle) 시장을 겨냥한 차세대 트랙션 인버터 참조 설계를 발표했다. 이번 백서는 전기 이륜차, 삼륜차, 마이크로 모빌리티 등 다양한 LEV 플랫폼에 빠르고 유연하게 적용 가능한 전력변환 솔루션을 제시하고 있다. 이번 참조 설계는 48V, 72V, 96V DC 전압 애플리케이션을 지원하며, 3kW에서 최대 15kW까지 전력 확장이 가능한 모듈형 구조로 설계됐다. NXP의 S32K3xx MCU와 Vishay의 하프브리지 MOSFET 기반 전력 모듈을 바탕으로 하드웨어와 임베디드 소프트웨어가 통합된 형태다. IEC61508 표준을 기반으로 한 기능 안전과 내장형 과전류 보호, 실시간 열 모니터링 등의 안정성 기능도 제공한다. 특히 고효율 전력변환을 위한 최적화된 PWM 제어, 최대 1000V 절연, 온도 센서 3개 지원, 회전식 리졸버 및 홀센서 기반 속도 피드백 기능 등 다양한 LEV 환경에 필요한 정밀 제어 기능이 포함됐다. 전원 보드는 최대 80V / 200A의 하프브리지 MOSFET을 통합해 낮은 온저항과 열저항 특성을 갖추고 있으며, 기생 인덕턴스를 최소화한 설계로

인터뷰