라온피플의 머신러닝 아카데미(10)

라온피플의 머신러닝 아카데미(10) - GoogLeNet (1)

등록 2019.02.07 09:25:46

URL복사

[첨단 헬로티]

머신비전산업에서 인공지능 기술(머신러닝, 딥러닝)이 빠르게 확산되고 있다. 인공지능 기술을 통해 기존의 컴퓨터비전 기술로는 어려웠던 검사가 가능해질 뿐만 아니라 ‘데이터의 자기 학습’으로 보다 빠르고 쉬우며 신뢰성과 유연성을 갖춘 머신비전 검사가 가능해졌다. 이에 따라 자연스럽게 인공지능 기술에 대한 관심이 높아지고 있다. 국내 대표적인 머신비전 전문업체인 라온피플은 ‘LAON PEOPLE’s 머신러닝 아카데미’를 통해 인공지능의 대표적인 기술인 머신러닝 기술에 대해 연재한다.

CNN(Convolutional Neural Network) – "GoogLeNet (part1)"
2014년 ILSVRC는 구글의 GoogLeNet이 차지하였고, 아주 근소한 차이로 옥스퍼드 대학교의 VGGNet이 2위를 차지한다. 그런데 여기서 주목해야 할 것은 2014년부터 CNN의 구조에 큰 변화가 나타나기 시작한다는 점이다. AlexNet이나 ZFNet 그리고 원조격인 LeNet5는 2014년 구조에 비하면 아주 단순한 편이며, 전형적인 형태를 취하고 있고, 망의 깊이도 10 layer 미만이다. 2014년 변화의 특징은 한마디로 "deeper"라고 표현을 할 수 있다.

GoogLeNet이나 VGGNet은 2012년 Krizhevsky의 AlexNet에서 촉발된 에너지를 바탕으로 새로운 변화를 모색하게 되었으며, CNN을 통한 학습 능력이 훨씬 더 커지게 되었음을 입증하였다. 이번 Class부터 GoogLeNet의 구조에 대하여 설명할 예정이다. 이해를 돕기 위해 여러 part로 구성이 될 예정이며, VGGNet은 GoogLeNet에 대한 Class를 마치고 따로 자세히 설명을 할 예정이기는 하지만, 중간 중간에 필요에 따라 VGGNet에 대한 설명도 곁들일 예정이다.

망은 깊어진다 (deeper and deeper) !!

CNN의 성능을 향상시키는 가장 직접적인 방식은 망의 크기를 늘리는 것이다. 여기서 망의 크기를 늘린다는 것은 단순하게 망의 layer 수(depth)를 늘리는 것뿐만 아니라, 각 layer에 있는 unit의 수(width)도 늘리는 것을 의미한다. 특히 ImageNet 데이터와 같이 대용량 데이터를 이용해 학습을 하는 경우는 거의 필수적이라고 할 수 있다. 아래 그림은 image classification의 성능 향상을 위해 CNN의 구조가 어떻게 바뀌고 있는지를 명쾌하게 보여주는 그림1이다.

그림1

2013년까지는 CNN 망의 깊이가 10 layer 미만이었지만, 2014년의 대표주자인 GoogLeNet과 VGGNet은 각각 22 layer와 19 layer로 깊어지게(deeper) 된다. 물론 top-5 에러율도 각각 6.7%와 7.3%로 낮아지게 된다. AlexNet의 결과가 나온 뒤 불과 2년 만에 에러율을 약 10% 정도 낮추는 쾌거를 이루게 된다. 2015년 우승을 한 ResNet은 망의 깊이가 152 layer 로 더욱 깊어지게 되며, top-5 에러율도 3.57%로 더욱 낮아지게 된다.

망이 깊어지면, 부작용(side effect)는 없나?
망의 크기를 늘리면 성능을 더 높일 수 있지만, 적절하지 못하면 다음 2가지 중대한 문제를 만날 수도 있다. 우선 망이 커지면 커질수록 자유 파라미터(free parameter)의 수가 증가하게 되며,이렇게 되면 특히 학습에 사용할 데이터 양이 제한적인 경우에 더 심각한 문제가 되지만, 망이 overfitting에 빠질 가능성이 높아진다. (즉, 학습 데이터에만 특화된 결과가 만들어져, 실제 테스트 set에 적용하면 만족할 만한 결과가 나오지 못할 수 있다.) 그리고 대량의 데이터에 사람이 일일이 label을 달아주는 것도 쉬운 일이 아니다. 또 다른 문제는 망의 크기가 커지면 그만큼 연산량이 늘어나게 된다. 예를 들어 필터의 개수가 증가하게 되면, 연산량은 제곱으로 늘어나게 된다. 연산 능력이 뛰어난 GPU를 사용하더라도 연산량의 증가는 심각한 문제가 된다. 그리고, ZFNet을 학습하면서 살펴보았던 것처럼, 학습이 잘못되어 filter의 kernel이 특정한 무리로 쏠리게 된다면, 기껏 망의 크기를 늘렸음에도 불구하고, 최적의 결과를 얻지 못할 수도 있다.

GoogLeNet보다 layer 수가 작은 AlexNet 경우를 살펴보자.
AlexNet [1] 에서 살펴본 것처럼, AlexNet은 엄청난 연산을 필요로 한다. AlexNet은 자유 파라미터의 개수가 6000만개이고 약 6억 3000만개의 connection으로 이루어져 있으며, 엔비디아의 GTX580 dual-GPU를 이용하여도 학습 시간이 일주일 넘게 소요되었다. 단순하게 망을 깊게 만든다면, 자유 파라미터의 개수가 더욱 많아질 것이고, connection도 엄청나게 많아지면서, 학습에 필요한 시간도 더욱 길어지게 된다. 또한 parameter 값이 정해지더라도 실제 연산을 할 때의 연산량 역시 무시할 수 없게 되고 말 것이다. 그리고 모바일이나 embedded 시스템에서 CNN을 활용하고자 한다면, 연산 능력이나 메모리 사용 등에서 PC 를 사용할 때보다 훨씬 제한될 수밖에 없기 때문에, 단순히 망을 깊게 만든 것이 아니라, 뭔가 구조적인 고민이 필요하다.

GoogLeNet과 Inception
크리스토퍼 놀란 감독의 영화 인셉션(Inception)을 보면, 남에게 어떤 생각(꿈)을 주입하거나, 남의 생각을 읽어내는 내용이 나온다. 구글의 연구팀들은 그 영화에서 컨셉을 따와 인셉션이라는 이름을 갖는 CNN모듈을 만들어 낸다. 구글의 소개 자료를 보면 항상 다음과 같은 그림2가 등장한다. 이는 더 깊은 CNN 구조를 사용하면 더욱 좋은 성능을 얻을 수 있다는 것 때문인 것 같고, 또한 인셉션의 내용이 남의 생각을 읽어내듯, DNN을 이용한 데이터로부터 중요한 정보를 얻어내는 것을 연상하여 지은 이름 같다.

그림2

구글이 발표한 인셉션의 기본 구조는 아래와 같으며, 대충 봐도 무지 복잡해 보인다. 같은 layer에 서로 다른 크기를 갖는 convolutional filter를 적용하여 다른 scale의 feature를 얻을 수 있도록 했다. 그림3에서처럼, 1x1 convolution을 적절히 사용하여 차원을 줄이고(reduce dimension) 망이 깊어졌을 때 연산량이 늘어나는 문제를 해결하였다. 이 부분은 다음 class에서 자세하게 설명할 예정이다. (비록 복잡해 보이지만, 그 개념과 원리를 이해하면 충분히 공감이 갈 구조이다.)

그림3

GoogLeNet은 구글의 연구팀들이 인셉션 모듈을 고안한 뒤에 2014년 ILSVRC에 참가하기 위한 버전으로 내놓은 것이며, 인셉션의 구조는 다양한 형식으로 적용이 가능하다.

AlexNet과 GoogLeNet을 비교한 그림은 그림4와 같다.
놀라운 부분은 망의 깊이는 훨씬 깊은데 free parameter의 수는 1/12 수준이고 전체 연산량의 숫자도 AlexNet에 비해 적다는 것을 알 수가 있다. GoogLeNet과 인셉션에 대한 설계 철학을 정확하게 이해를 하면 그 이유를 알 수 있으며, 역시 설명할 부분이 많아 다음 Class 에서 다룰 예정이다. 참고로 GoogLeNet에는 총 9개의 인셉션 모듈이 적용되어 있다.

그림4

정리하자면, 구글의 연구팀들은 망을 더 깊게 하여 성능 향상을 꾀하면서도, 연산량의 증가를 늘리지 않는 CNN 구조를 개발하기 위해 많은 연구를 하였다. 결과적으로 초기 CNN 구조가 적합하지 않다는 것을 발견하였으며, 효과적으로 차원을 줄이면서 망을 깊게 할 수 있는 방법으로 인셉션 모듈을 개발하였다. 그 후에도 구글의 개발팀들은 인셉션을 더욱 발전시켜 자신들의 CNN연구의 기본으로 삼았으며, 관련 논문들도 많이 발표를 하였다.
여기까지 구글의 GoogLeNet이 이전 CNN 구조와 많이 다르다는 것에 대하여 간단하게 살펴보았다. 다음에는 그들의 설계 철학과 왜 이런 구조를 발전시키게 되었는지에 대해 상세하게 살펴볼 예정이다.

(주)라온피플

[CLICK BOOK] ‘2024 디지털 전환 가이드북’ 발간...“DX 위한 필독서”

산업 기술 전문 미디어 그룹 ㈜첨단이 제조 혁신을 위한 필독서 ‘2024 디지털 전환 바이어스 가이드’(2024 DXBG)를 발간했다. 디지털 전환(DX) 바이어스 가이드는 중소·중견기업이 직면한 디지털 전환의 복잡성을 해결하고, 성공적인 전환을 이룰 수 있도록 설계된 종합적인 자료집이다. 이 가이드북을 통해 기업들은 디지털 전환의 필요성을 인식하고, 관련 기술과 솔루션을 이해함으로써 보다 빠르고 효율적인 변화를 도모할 수 있다. 디지털 전환의 핵심은 단순히 기술의 도입에 그치지 않고, 이를 통한 제조 공정의 혁신, 운영 효율성의 극대화, 그리고 최종적으로는 시장에서의 경쟁 우위 확보에 있다. 디지털 기술은 제품과 서비스의 개발부터 생산, 유통에 이르기까지 전 과정에 걸쳐 혁신적인 변화를 가능하게 한다. ‘디지털 전환 바이어스 가이드’에서 제공하는 정보와 사례들은 기업들이 이러한 변화를 실제로 어떻게 적용할 수 있는지에 대한 구체적인 가이드라인을 제시한다. 또한 정부의 지원사업과 같은 외부 자원을 활용하여 디지털 전환 과정에서 발생할 수 있는 재정적 부담을 완화하는 방안도 소개하고 있다. 이 가이드북은 디지털 전환을 고민하는 기업뿐만 아니라, 산업 전반에 걸

[한국머신비전산업협회 24년 3월 협회보] 머신비전의 현재와 미래를 한눈에…제12회 한국머신비전산업전 개최

(사)한국머신비전산업협회(회장 김일목, 이하 KMVIA)는 지난 3월 16번째 협회보를 발간했다. 이번 협회보는 3월 27일부터 29일까지 코엑스에서 개최된 한국머신비전산업전에 출전하는 협회 회원사 내용을 중점적으로 다루고 있다. 한편, 협회는 매년 상반기와 하반기 협회보를 발행하고 있다. 품질 검사에서 가장 활발하게 사용돼 왔던 머신비전 기술. 4차산업혁명 시대 모든 산업에서 머신비전이 중요한 기술로 자리잡고 있다. 특히, 최근에는 딥러닝 등 AI기술이 융합되면서 머신비전 기술도 한단계 진화되고 있다. 3D, 스마트카메라, 센서의 진화, 소형화, 임베디드 비젼, 로봇기반 비젼, AI 융합 등 요즘 머신비전 분야의 핫 키워드다. 협회보에는 회원사 소식 뿐만 아니라 국내외 최신 머신비전 산업 트렌드, 그리고 신제품과 신기술 등 다채로운 정보를 담고 있다. <2024년 3월 협회보 주요 내용> 특집 머신비전의 현재와 미래를 한눈에…제12회 한국머신비전산업전 개최 신규 회원사 인터뷰 픽잇코리아 “로봇 3D 비전 기술로 스마트팩토리 실현 가속화” 포스로직 “세계 최고 이미지 프로세싱 기술로 머신비전 시장 혁신 주도” 파아일랜드 “토탈 엣지 솔루션으로 머신

[오픈컨트롤 백서] AVEVA Operations Control

Aligning teams towards operations excellence 산업 소프트웨어 업체 오픈컨트롤이 아비바(AVEVA)사의 오퍼레이션 컨트롤(AVEVA Operation Control)을 소개했다. 아비바 오퍼레이션 컨트롤은 조직을 최상의 상태로 운영하는 데 필요한 소프트웨어를 제공한다. 모든 규모의 기업에게 실행 가능한 정보를 제공하여 실시간으로 더 나은 의사 결정을 내리고 엣지에서 엔터프라이즈에 이르기까지 응집력 있고 지속 가능한 소프트웨어 프레임워크를 통해 운영 효율성, 안정성 및 민첩성을 향상하고 향상시킨다. 아비바 오퍼레이션 컨트롤을 통해 기존의 HMI 및 SCADA를 넘어 더 큰 효율성과 직업간 협업능력을 향상시킬 수 있다. 아울러 제조 실행, 분석 및 풍부한 클라우드 기반 기능을 포함하는 AVEVA의 풍부한 제품군에 원활하게 액세스 할 수 있다. 헬로티 최재규 기자 |

2024 스마트 제조 대전망 온라인 컨퍼런스 2일차 오전

AI, 로봇, 디지털트윈, 클라우드가 지배하는 디지털 제조의 새로운 시대가 우리에게 다가왔습니다. 점점 더 많은 제조업체가 이러한 변화를 수용하고 데이터 기반 통찰력을 활용하여 보다 지속 가능하고 효율적인 제조 관행을 향해 나아가고 있습니다. 국내 제조 산업은 최첨단 기술의 융합이 비즈니스의 역동적인 과제를 충족시키는 놀라운 변화를 맞이할 준비가 필요합니다. 제조 업체의 경우 이러한 변화를 이해하는 것이 중요합니다. 이는 단순히 기존 프로세스를 변경하는 것이 아닙니다. 이는 패러다임의 변화를 나타내며 제조 실행 및 전략의 새로운 시대를 예고합니다. 이것은 적응 이상의 것입니다. 이는 2024년 이후의 제조 정신을 완전히 재구상하는 것이어야 합니다. - 스마트오퍼레이션 세션 (오전) 스마트제조의 첫걸음은 현장의 개선입니다. 현장에서 업무나 생산효율성을 높여줄 수 있는 기술과 스마트제조의 근간이 되는 정확한 제조데이터를 뽑아낼 수 있는 주요 기술들의 트렌드와 전망에 대해 알아봅니다. 특히, 현장에서 설비 상태는 센서를 사용하여 자산 상태의 실시간 상태 모니터링을 가능하게 하여 계획되지 않은 가동 중지 시간을 제거하고 자산의 사용 수명을 연장하는 동시에 유지 관리

2024 스마트 제조 대전망 온라인 컨퍼런스 2일차 오후

AI, 로봇, 디지털트윈, 클라우드가 지배하는 디지털 제조의 새로운 시대가 우리에게 다가왔습니다. 점점 더 많은 제조업체가 이러한 변화를 수용하고 데이터 기반 통찰력을 활용하여 보다 지속 가능하고 효율적인 제조 관행을 향해 나아가고 있습니다. 국내 제조 산업은 최첨단 기술의 융합이 비즈니스의 역동적인 과제를 충족시키는 놀라운 변화를 맞이할 준비가 필요합니다. 제조 업체의 경우 이러한 변화를 이해하는 것이 중요합니다. 이는 단순히 기존 프로세스를 변경하는 것이 아닙니다. 이는 패러다임의 변화를 나타내며 제조 실행 및 전략의 새로운 시대를 예고합니다. 이것은 적응 이상의 것입니다. 이는 2024년 이후의 제조 정신을 완전히 재구상하는 것이어야 합니다. - 스마트제어시스템 세션 (오후) 지능형 모션 제어는 고도로 유연하고 효율적인 제조를 가능하게 하는 스마트 제조의 핵심 빌딩 블록입니다. 지능형 모션 제어는 정밀 피드백, 고급 감지, 고성능 제어 및 원활한 연결을 결합하여 결정적 모션 솔루션을 제공합니다. 그만큼 스마트제조 구현을 위해서는 제어시스템의 역할이 중요합니다. 스마트제조에서 더 높은 수준의 성능과 자율성을 제공하는 데 필요한 요소들인 SCADA, IPC

2024 스마트 제조 대전망 온라인 컨퍼런스 1일차 오후

AI, 로봇, 디지털트윈, 클라우드가 지배하는 디지털 제조의 새로운 시대가 우리에게 다가왔습니다. 점점 더 많은 제조업체가 이러한 변화를 수용하고 데이터 기반 통찰력을 활용하여 보다 지속 가능하고 효율적인 제조 관행을 향해 나아가고 있습니다. 국내 제조 산업은 최첨단 기술의 융합이 비즈니스의 역동적인 과제를 충족시키는 놀라운 변화를 맞이할 준비가 필요합니다. 제조 업체의 경우 이러한 변화를 이해하는 것이 중요합니다. 이는 단순히 기존 프로세스를 변경하는 것이 아닙니다. 이는 패러다임의 변화를 나타내며 제조 실행 및 전략의 새로운 시대를 예고합니다. 이것은 적응 이상의 것입니다. 이는 2024년 이후의 제조 정신을 완전히 재구상하는 것이어야 합니다. - 스마트제조이슈 세션 (오후) 최근 산업현장에서의 스마트제조 이슈는 다양합니다. 정부의 지원 정책부터 산업별 솔루션의 업그레이드, 새로운 기술과의 융합으로 인한 효율성과 생산성의 향상, 그리고 어느때보다 중요해지고 있는 IT/OT보안까지 모든 것들이 스마트제조의 이슈라고 볼 수 있습니다. 이러한 이슈와 함께 디지털 혁신을 수용하는 것은 제조업체에게 나름의 과제를 안겨줍니다. 또한 그만큼의 투자가 필요하기도 합니다

칼럼