배너
닫기

일반뉴스

배너

오픈엣지, 연산 성능 4배 향상된 NPU '인라이트 프로' 발표

URL복사
[선착순 마감 임박] AI분야 특급 전문가들과 함께 AI로 우리 기업의 미래 경쟁력을 확보하는 방법을 공유합니다. AI 비즈니스 개발 융합 컨퍼런스에서 확인하세요 (5/3, 코엑스 E홀)

 

 

 

오픈엣지테크놀로지(이하 오픈엣지)가 기존 제품 대비 최소 4배 개선된 성능을 자랑하는 고성능 신경망처리장치(NPU) ‘인라이트 프로(ENLIGHT PRO)’를 출시했다고 밝혔다. 

 

이 신제품은 업계 최초로 개발된 엣지 환경을 목표로 하는 4·8비트 혼합정밀도 NPU IP ‘인라이트’의 후속 버전으로, 이전 버전보다 성능을 최소 4배 이상 향상시켰을 뿐 아니라, 새로운 신경망에 대응하는 확장성과 유연성을 강화한 NPU IP다. 이는 특히 성능과 유연성이 동시에 요구되는 완전 자율주행, 카메라, 모바일 기기 등의 온디바이스 AI 제품에 적합하다. 

  

자율주행 기술은 운전자의 조작 없이 스스로 주행하는 차량의 능력을 의미하며, 레벨 0부터 레벨 5까지 총 6단계로 분류된다. 현재 가장 널리 사용되는 레벨 2의 운전자 주행을 보조하는 ADAS(Advanced Driver Assistance System)가 대표적인 예시다. 최근에는 특정 조건 하에서 작동하는 레벨 3 자율주행 기술이 탑재된 차량도 출시됐지만, 대부분의 자율주행 기술은 여전히 레벨 2에 머무르고 있다. 

 

레벨 3 이상의 자율주행을 위해서는 칩당 최소 100 TOPS(Terra Operations per Second)에서 1000 TOPS 이상의 데이터 처리 속도를 제공하는 고성능 NPU가 필요하다. 그러나 높은 성능과 함께 소비 전력 효율성이 높고, 저전력 설계가 요구되는 자율주행 기술 개발은 여전히 개발 난도가 높아, 자율주행 개발은 더디게 진행 중이다. 


오픈엣지의 엣지용 ‘인라이트 프로’는 에너지 제약이 큰 환경에서도 대규모 언어모델(LLM)의 핵심 구성 요소인 트렌스포머를 지원하는 신경망 가속기로 개발됐다. 기존 ‘인라이트’에 비해 MAC(Multiply-Accumulate) 연산 성능이 4배 이상 향상, 벡터 프로세서 성능은 64배 개선, 부동소수점 처리 기능의 지원 범위 확장 등을 통해 메모리-연산 간의 빠른 상호작용이 가능해졌다. 

 

인라이트 프로는 최소 8 TOPS에서 수백 TOPS의 성능까지 확대 가능하다. 또한, 오픈소스 아키텍쳐인 RISC-V 를 사용해 반도체 설계를 위한 비용을 최소화하고 하드웨어 리소스를 적게 사용하면서도 유연성과 확장성을 강화해 다양한 신경망을 지원하도록 했다. 오픈엣지는 인라이트 프로와 함께 컴파일러와 양자화 개발환경을 포함하는 소프트웨어 개발 키트(SDK)를 제공해 사용자 편의성을 극대화했다. 인라이트 프로는 출시와 함께 이미 고객 확보에도 성공했다. 

 

NPU의 고성능화가 진행됨에 따라, 대용량 데이터를 신속하게 처리할 수 있는 메모리 시스템 개발의 중요성이 커지고 있다. 특히 엣지 디바이스에서의 LLM 구동은 프로세싱이 아닌 메모리 대역폭에서 성능이 제한되는 현상을 보여주고 있다. 이러한 상황에서 오픈엣지의 NPU IP와 메모리 시스템 IP는 상호 유기적으로 통합돼 최적화한 형태로 반도체 설계업체에 제공된다. 이렇게 NPU와 메모리 시스템을 최적화시킨 AI 반도체 플랫폼을 제공하는 것은 세계적으로 유일하게 오픈엣지만이 제공하는 차별점이다.  


오픈엣지 이성현 대표는 “오픈엣지는 올해 하반기에 자동차 기능 안전에 대한 국제 표준인 ISO26262 인증을 획득할 예정이며, 이를 바탕으로 검증된 자율주행용 IP를 활용해 글로벌 고객사와의 라이선스 계약 체결을 확대할 것”이라고 말했다. 또한, “적극적인 R&D 연구개발을 통해 레벨 3이상의 고성능 자율주행 반도체 칩에 적용되도록 노력하겠다”고 덧붙였다.

 

헬로티 서재창 기자 |










배너









주요파트너/추천기업