닫기
배너

데이터인큐베이터 “빅데이터 기술을 확보해야 4차 산업 혁명 리딩할 수 있다”

URL복사

[첨단 헬로티] 


IT 업계뿐만 아니라 모든 산업은 점차 데이터 중심의 사회로 변화되고 있다. 이에 따라 데이터를 활용하는 기술은 회사 성장에 있어 매우 중요한 요소다. 2009년 미국 뉴욕에 설립된 데이터 인큐베이터(미국명 Data Science Evangelists, Inc.)’는 미국의 뉴욕, 워싱턴D.C, 보스턴 및 샌프란시스코에 거점을 두고 활동하는 빅데이터 지식그룹으로, 글로벌 500대 기업의 데이터 및 인공지능 교육 및 컨설팅을 구축하고 있다. 


최근에는 한국을 포함해 여러 국가에 지사를 설립해 비즈니스를 확장해 나가고 있는 중이다. 데이터인큐베이터의 비즈니스 모델은 ▲빅데이터 과학자를 양성하는 교육 프로그램 제공 ▲빅데이터 비즈니스 컨설팅 ▲빅데이터 시스템 구축 등 크게 3가지 영역으로 나뉜다. 문영상 데이터 인큐베이터 코리아 CTO, 박영은 데이터 인큐베이터 코리아 CEO를 만나 빅데이터의 중요성과 데이터 인큐베이터의 비즈니스에 대해 이야기를 들어봤다.


▲박영은 데이터 인큐베이터 코리아 CEO / 문영상 데이터 인큐베이터 코리아 CTO


Q. 제 4차 혁명 시대, 데이터 과학자(Data Scientist)가 주목 받는 이유는 무엇인가요? 


앞으로 4차 혁명 시대에는 모든 사회 기반 시스템이 데이터 중심으로 돌아간다고 해도 과언이 아니다. 농업으로 비유하면 데이터는 쌀이며, 벼를 심고 수학하는 농부의 역할이 4차 혁명 시대에서는 데이터를 활용할 수 있게 구축하는 작업이며, 이를 ‘데이터 과학자(Data Scientist)’라고 해도 될 것이다. 이러한 데이터 과학자를 농부라고 비유할 수 있다. 데이터 과학자는 2010년대에 들어서서 알려지기 시작한 새로운 직종이다. 


미국은 전세계에서 4차 산업 혁명 시대의 준비가 잘 되어 있는 나라로 꼽힌다. 실제로 미국의 대다수의 기업들은 현재 데이터 중심으로 경영, 의사 결정을 하고 있다. 과거에는 직원을 신규로 뽑을 때, 경영학과, 회계학 등 특정 학과를 전공한 사람을 채용했다면, 이제는 데이터를 다룰 수 있는가를 보고 채용하고 있다. 즉, 미국에서는 “데이터 과학자를 많이 확보한 기업이 4차 산업 혁명을 리딩할 수 있다”고 판단하고 있다.

일례로, 미국에 본사를 둔 글로벌 컨설팅 및 회계 전문 기업 컨설팅사의 회장은 지난해 언론 인터뷰를 통해 앞으로 데이터 과학자가 아니면 직원을 뽑지 않겠다고 밝힌 바 있다. 이 회사는 올해만 해도 미국 본사 직원을 약 2000명 채용하는데, 전부 데이터 과학자만 뽑을 예정이라고 할 정도로 이 분야의 수요는 높아지고 있다.

그러나 데이터 과학자 수요에 비해 인력이 많지 않은 편이다. 미국에서만 2025년까지 약 250만명 정도의 데이터 과학자가 필요하다고 하지만, 실제로 배출 인구는 많아야 3만명 정도 수준이다. 이처럼 미국의 대다수 기업들은 데이터 과학자 직원을 구하기 어려운 실정이다. 이러한 비즈니스 가능성 보고, 데이터인큐베이터는 데이터 과학자를 양성하는 비즈니스를 시작했다. 


또 한국에서도 정부, 사회 각계에서 데이터 중심의 사회로 변화되고, 빅데이터 시장이 성장되고 있는 추세에 있어 데이터인큐베이터 코리아가 2017년 1월에 설립하게 됐다. 이에 한국지사는 아시아 전체 시장에서도 매우 중요한 위치에 있다.


Q. 데이터인큐베이터의 데이터 과학자 양성 프로그램의 특징은 무엇인가요? 


데이터 과학자 양성 프로그램은 단순히 교육을 시켜서 전문가를 양성하는 것이 아니라, 데이터 과학자가 필요한 기업에게 적합한 인재를 채용할 수 있게 끔 연계 해주는 역할 또한 수행 한다. 


데이터 과학자 양성 프로그램 중 펠로우쉽(Fellowship) 코스는 기본적으로 산업도메인과 수학, 통계학에 지식과 경험을 가지고 있는 사람들을 대상으로 하며, 주로 석사 이상의 학위를 지니거나 새롭게 커리어를 바꿔 보고자 하는 대학 교수 등이 지원을 많이 하는 편이다.

이 프로그램은 약 100명의 지원자중 단 3%만 선발해 교육을 운영하는 최상의 권위있는 과정이기 때문에 데이터 과학자를 필요로 하는 글로벌 기업 및 대형기업에서 이 과정을 통과한 과학자를 선호한다. 뉴욕 타임즈에서는 “데이터 과학자 교육 코스는 하버드 대학에 들어가는 것 보다 어렵다”라고 말할 정도로 경쟁률이 꽤 높다.

데이터인큐베이터는 교육뿐 아니라 데이터 과학자의 네트워크 허브 역할도 하고 있다. 글로벌 경제 비즈니스 매거진 ‘포춘’에서는 매년 500대 기업을 선정하는데, 데이터인큐베이터는 그 기업들과 스폰서쉽이 맺어 있다. 예로, 관련 기업들이 데이터 과학자가 10명이 신규로 필요하다고 의뢰하면, 우리는 전세계를 상대로 데이터 과학자 교육 세션을 오픈해 8주 집중 트레이닝을 실시하게 된다. 교육비는 데이터 과학자를 모집하는 기업들이 후원한다. 이런 교육 시스템을 미국 기업 환경 측면에서 보면 우리나라와 달리 근로자의 교육 투자에 대해 긍정적이기 때문에 가능하다.

미국에서 초임 연봉이 평균 4만~5만 달러, 이공계 졸업생은 6~7만 달러라고 한다. 반면, 직장 경력이 없는 사람도 데이터 과학자 수업을 이수하면 인증을 취득하면 연봉 10만 달러부터 시작할 수 있기 때문에 이 직업이 각광받고 있는 이유다. 


Q. 빅데이터 컨설팅 비즈니스가 국내서 필요한 이유는?  


데이터인큐베이터의 두번째 비즈니스는 빅데이터 컨설팅이다. 특히 우리나라의 경우 기업이 데이터 과학자 육성 측면에서 보면 인색하기 때문에 오히려 글로벌 선진 사례 및 다양한 컨설팅 기법을 국내에 제공하는 사업에 주력하고 있다. 이를 통하여 기업내 다양한 프로세스 및 데이터를 먼저 분석하고 다양한 서비스와 전략을 녹여 빅데이터 프로젝트를 진행하게 된다. 


더욱이 한국에서는 빅데이터 프로젝트의 실패율이 매우 높은데 그 이유는 데이터가 없기 때문이다. 아무리 뛰어난 인공지능 기술도 데이터가 없으면 아무런 의미가 없다. 실제 금융을 포함한 다양한 산업군에서는 외부 데이터 활용율이 매우 낮은 것이 현실이고 외부 데이터 중에서 오픈데이터는 쓸모 있는 데이터가 적거나 생성 주기가 오래된 데이터일 가능성이 높은 것이 현실이다. 또 그 마저도 활용에 있어 각종 규제에 가로 막혀 적용이 쉽지 않다. 이를 위해 우리는 다양한 데이터 관련 기업과 제휴하여 데이터 및 솔루션을 공급하는데 많은 역량을 쏟고 있다.


국내 빅데이터 시장은 단순히 하둡을 중심으로 한 빅데이터 시장 만을 본다면 문제가 발생될 소지가 있다. 이는 단순히 관계형 데이터베이스에서 하둡으로 플랫폼만 바뀌게 되는 것과 다를 바가 없기 때문이다. 따라서 데이터 인큐베이터는 내재하고 있는 많은 경험과 선진사례를 통해서 비즈니스를 전개하고 있다.


▲ 한국 지사가 자체 개발한 빅데이터 솔루션


Q. 자체 개발한 빅데이터 플랫폼의 기술 특징은 무엇인가요? 


데이터인큐베이터코리아의 빅데이터 구축 사업은 오픈 소스를 포함한 엔터프라이즈 영역의 다양한 솔루션 벤더와 제휴해 다양한 비정형데이터 처리 소프트웨어를 공급하고 있다. 어떠한 서비스 모델로 어떠한 데이터를 가지고 구축하려고 하는지에 대해서 산업군 별로 차이가 존재하는데, 이러한 부분을 객관적으로 분석해서 맞춤형 솔루션을 제공하고 있다.


일반적으로 빅데이터 솔루션 구축 비용은 적게는 5~10억 원이 들게 되는데, 이 금액은 중소기업, 학교 등의 입장에서 부담이 될 수밖에 없다. 이를 위해 데이터인큐베이터 코리아는 기존 비용대비 합리적인 비용으로 빅데이터 솔루션 및 빅데이터용 전용 오플라이언스를 공급하고 있다. 이런 빅데이터 솔루션은 교육에서부터 간단한 실습용, 엔터프라이즈까지 다양한 제품군이 구비돼 있고 대학 및 중소기업에서 실습 및 파일럿 구축이 가능한 모델도 공급되고 있다. 향후 가까운 시일내에 엔터프라이즈 시스템도 공급할 예정이다. 


한국 지사가 자체 개발한 빅데이터 솔루션인 ‘데이터스페이스’는 빅데이터 처리에 필요한 각종 비정형데이터 처리에 최적화된 소프트웨어와 하드웨어를 함께 제공함으로써 합리적인 비용으로 빅데이터를 사용할 수 있게 구축했다. 


데이터스페이스의 구성적인 측면에서 살펴보면, 빅데이터의 오픈소스는 주로 병렬처리 기술과 클러스터링 처리 기술을 중심으로 한 ECO 소프트웨어와 시스템으로 이루어져 있다. 우리의 솔루션은 하나의 시스템에 8개의 노드가 들어 있고 필요에 따라 노드의 수는 클러스터를 구성해 사용할 수 있다. 하나의 노드에 4개는의 CPU 코어(Core)로 구성돼 있고, 노드가 8개 들어있으니 이는 전체 32코어를 탑재되어 있다.

또한 관련 소프트웨어가 번들로 들어 있어 편리하다. 빅데이터를 시작함에 있어서 가장 많은 시간과 노력이 들어가는 것이 데이터의 적재다. 이러한 비정형데이터의 적재에 최적화돼 있는 자사 소프트웨어가 포함이 돼 있다. 물론 하드웨어에 포함되어 있기 때문에 특정 다른 업무에 사용하기 위해서는 별도 구매도 가능하다.

더불어 구성에 관련된 다양한 샌드박스를 제공한다. 샌드박스는 매뉴얼 형태로 제공돼 각종 Eco 소프트웨어 및 하둡을 매뉴얼만 이용하더라도 구성이 가능할 정도로 시스템화 됐고, 분석에 관련된 영역도 이미 글로벌 기업의 분석 소프트웨어가 번들로 탑재돼 있다.

현재 하드웨어와 소프트웨어 그리고 샌드박스, 자동화 처리 소프트웨어까지 포함된 경쟁 제품은 국내외에 없다고 자신 있게 말할 수 있다.


Q. 국내 진출 후의 성과와 앞으로의 목표는? 


다행스럽게도 데이터인큐베이터코리아는 한국 진출 첫해부터 흑자로 마무리했다. 국내에 진출한지 지난 1년간 주요 파트너 선정 및 교육과 홍보에 치중한 결과 한곳의 단독 총판과 9곳의 비즈니스 파트너사를 확보함으로써 비즈니스의 기반을 확충했다. 또 한국정보통신기술사협회 그리고 한국전자문서관리협회와 전략적 MOU를 체결하였다. 또한 시중 은행의 컨설팅 고객사를 확보했고, 각종 공공 및 대학등에 고객사를 확보했다. 앞으로 대형 공공기업 및 유통사 등의 빅데이터 프로젝트가 예상돼 올해 전망을 매우 낙관적으로 보고 있다. 


앞으로 국내만의 특화된 빅데이터 노하우 및 연구 개발을 발전시켜 다시 본사로 역수출을 하여 글로벌 시장으로 확대하고자 한다. 



















주요파트너/추천기업