닫기

일반뉴스

배너

카이스트, 칩 하나로 CNN과 RNN 동시 처리 가능한 인공지능 반도체 개발

  • 등록 2018.04.04 10:50:47
URL복사
[마감임박!! 무료] 생성형AI, 디지털트원, 제조AI, SaaS, 클라우드로 생산성 높이고, 비용절감 방안 제시.. AI자율제조혁신포럼 개최 (3/27~29, 코엑스3층 컨퍼런스룸 317~318호)

국내 연구진이 딥러닝을 보다 효율적으로 처리하는 인공지능 반도체를 개발했다. 한국과학기술원(이하 카이스트) 유회준 교수 연구팀은 팹리스 반도체 스타트업인 유엑스 팩토리와 공동으로 가변 인공신경망 등의 기술을 적용해 이 기술을 개발하게 됐다. 이 연구는 지난 2월 미국 샌프란시스코에서 열린 국제고체회로설계학회(ISSCC)에서 발표되며 많은 주목을 받기도 했다.



모바일에서 인공지능을 구현하기 위해서는 고속 연산을 저전력으로 처리해야 하지만, 현재는 연산 속도가 느리고 전력 소모가 큰 소프트웨어 기술을 활용하고 있어, 인공지능 가속 프로세서 개발이 필수적이다.


에너지 효율을 높이기 위한 인공지능 반도체 개발이 NVIDIA, Google을 포함한 기업과, Stanford, MIT등의 학계에서도 이루어지고 있으나, 통합된 코어 구조를 갖는 동시에 완전 가변 가능한 인공신경망을 지원하는 반도체 칩은 개발되지 못했다.


연구팀은 하나의 칩으로 회선 신경망(CNN: Convolutional NeuralNetwork)과 재귀 신경망(RNN: Recurrent Neural Network)을 동시에 처리할 수 있고, 인식 대상에 따라 에너지효율과 정확도를 다르게 설정할 수 있는 인공지능 반도체(UNPU: Unified Neural Network Processing Unit)를 개발함으로써 인공지능 반도체의 활용범위를 넓혔다.


회선 신경망은 2차원 데?의 학습에 적합한 구조를 가지며 이미지 내 객체 분류, 객체 탐지 등에 사용되고, 한편 재귀신경망은 시간의 흐름에 따라 변화하는 데이터를 학습하기 위한 딥 러닝 모델로 영상인식, 음성인식, 단어의 의미판단 등에 사용된다.


이번 연구 결과, 세계 최고 수준의 모바일용 인공지능 반도체 칩과 비교해 회선 신경망과 재귀 신경망의 연산 성능이 각각 1.15배, 13.8배 증가한 것으로 나타났다. 에너지 효율 또한 40% 향상을 달성했다.


연구 내용을 자세히 살펴보면, 연구팀은 비트 시리얼(Bit-serial) 기반의 연산을 수행하여 완전 가변한(1bit~16bit) 인공신경망 무게 정밀도 (Weight Precision)을 지원하는 반도체 칩을 개발했다. 테이블 참조 기반의 기법을 세계 최초로 개발 하여 회로의 에너지 소모를 1bit 기준 53% 가량 감소시킨 것이 특징이다. 


연구팀은 스마트폰 카메라를 통해 사람의 얼굴 표정을 인식해 행복, 슬픔, 놀람, 공포, 무표정 등 7가지의 감정상태를 자동으로 인식하고 스마트폰 상에 실시간으로 표시하는 감정인식 시스템도 개발했다.


작년 8월 IT 회사들이 개발한 반도체 칩을 발표하는 ‘HotChips’ 학회에서 초기 버전을 발표했음에도, 구글의 TPU(Tensor Processing Unit)보다 최대 4배 높은 에너지 효율을 보여 큰 주목을 받은 바 있다.


연구팀을 이끈 유회준 교수에게 이번 연구의 계기는 무엇인지 물었다. 그는 “2015년 알파고의 등장 이후부터 관심이 커지고 있어서 이전보다 분위기는 좋아졌지만 소프트웨어 중심으로 치우쳐져 반도체를 중심으로 인공지능 기술을 펼쳐가야 하겠다는 포부가 더욱 커졌다. 또한 중국, 미국 등이 경쟁적으로 인공지능 반도체에 대한 지원하면서 많은 스타트업들이 대두되고 있는 시점에서 우리나라도 연구를 진행하여 왔으며 가능성이 높다는 것을 보여 드리고 싶었다”고 밝혔다.


또한 그는 이번 연구의 특징에 대해 “이번 연구 결과는 비트 수와 구조의 변경이 가능한 딥러닝 가속기라는 점이다. 그동안에도 여러 번의 시도가 있었지만 이번처럼 완벽하게 변형이 가능한 경우는 없었다. 비유를 들자면 소프트웨어로 쉽게 변경이 가능한 CPU의 출현과 비슷한 것이다. 이전에는 회선 신경망이나 재귀 신경망 등 특정 용도에만 특화된 칩만 존재하였으나 이번에는 간단한 소프트웨어 조작만으로 하나의 칩에서 이 모든 신경망들이 저전력, 고성능으로 구현 가능하고 비트 수도 1비트부터 16비트까지 소프트웨어로 간편하게 가변할 수 있어 상황에 맞추어 최적화된 동작을 얻어낼 수 있다”고 설명했다.


이어 그는, “이번 연구는 모바일에서 인공지능을 구현하기 위해 저전력으로 가속하는 반도체를 개발했다는 점에서 의미가 크며, 향후 물체인식, 감정인식, 동작인식, 자동 번역 등 다양하게 응용될 것으로 기대된다”며 이번 연구의 의의를 밝히기도 했다.


유 교수의 목표는 국내 인공지능 칩 기술이 세계를 선도하고 새로운 응용 분야를 개척하는 것이라고 한다. 그는 “CPU와 GPU에서는 우리가 외국 칩을 사다가 썼지만 NPU(Neural Processing Unit)에서는 우리나라의 칩을 외국에서 사용하도록 하고 싶다. 또한 로봇이나 드론 등의 새로운 응용에서 우리나라 기업들이 인공지능 칩으로 선도 해나아 가야 할 것이며 이를 위해 스타트업들도 많이 나와야 한다고 생각한다. 카이스트의 인공지능 칩 기술이 이들이 세계 시장을 선도하는데 밑거름이 되고 싶다”고 말했다.


정부도 이러한 인공지능 연구개발에 적극 지원할 예정이다. 과학기술정보통신부 용홍택 정보통신산업정책관 “인공지능 서비스를 효율적으로 제공하기 위해 전 세계적으로 인공지능 반도체 개발을 추진하고 있다”며, “과기정통부도 산업부와 협력하여 인공지능 반도체 기술 개발을 위한 대형 사업을 기획하고 있으며, 올해 중 예비타당성 조사를 신청할 계획이다”고 밝혔다. 










배너









주요파트너/추천기업