[헬로티]
IoT 시대의 도래로 새로운 정보보안 대책 마련이 요구됨에 따라 인공지능 기술이 결합된 보안기술에 대한 연구가 활발하다. 인지시스템의 높은 활용 잠재력은 매우 다양한 분야에 더 많은 정보 획득과 자동화 트렌드를 가속시킬 수 있을 것으로 예상된다. 인공지능 기술이 접목된 인지시스템 기술이 확산되면서 이 분야에 대한 글로벌 ICT 기업들의 투자가 가속화될 것으로 예상된다.
서언
Google의 인공지능 소프트웨어 시스템인 딥 마인드(Deep mind)의 알파고(AlphaGo)와 세계 바둑 챔피언 이세돌 9단이 2016년 3월 9일부터 시작한 다섯 차례의 대국에서 알파고는 4:1 승리를 이끌었다1).
알파고-이세돌 대국은 게임(game)의 차원을 넘어 딥 러닝(Deep learning) 기술이 예측, 모델링 등 소비자 및 기업에 광범위하게 적용할 수 있음을 발견했다는 것이다2).
예측 및 모델링 시스템과 연계된 자문시스템이 향후 기업 운영에서 차별화 전략으로 중요하게 작용할 것으로 예상하고 있다. 이러한 사례를 간단히 요약하면 다음과 같다[1].
- 데이터 과학자와 딥 러닝에 막대한 투자를 하고 있는 클라우드 CRM 기업 세일즈포스(Salesforce)가 있다. 이를 통해 모든 사람들이 가상의 개인비서 서비스를 제공받을 수 있을 것으로 기대하고 있다3).
- InsideSales 및 Afiniti 등의 기업들이 있다. 이들 기업들은 인공지능(AI)과 인지시스템(cognitive systems)을 이용하여 텔레마케팅 에이전트(tele-marketing agent)에게 최선의 대응방법을 예측하는 데 도움을 주고 있다4).
우리는 지금 기계(computing machine)의 도움을 받는 새로운 시대로 급속하게 나아가고 있다. 초고속 대용량 연산기능이 기하급수적으로 발전하고, 생성/저장/액세스할 수 있는 데이터의 양이 급증하면서 빅데이터 분석 기술이 발전하고 있다. 이를 통해 고 수준의 컴퓨팅 알고리즘으로 성장을 지속할 것으로 예상하고 있다.
한편으로는, 이러한 고 수준의 컴퓨팅 알고리즘을 이용하여 지식을 추론하는 능력으로 인해 데이터 프라이버시 문제가 발생하고 있다[1].
데이터는 애플리케이션을 구동하는 소스(driving source)가 되기 때문에 일상생활 정보 서비스에서부터 사물인터넷(IoT) 서비스까지 거대한 데이터 시장이 형성되고 있다.
이를 통해 ‘data-application-driving source’로 연결되는 서플라이 체인을 형성해가고 있다.
이 연구에서는 인공지능 기술과의 융합을 통해 정보보안 위협에 대응하기 위한 정보보안 영역의 인공지능 활용 분야와 인공지능 도입을 위한 기술 개발 이슈를 중심으로 인공지능 기술과 보안 이슈, 인공지능 기술로 인해 비정형 데이터의 정보 처리 및 정보 분석 기술 시장에 획기적인 변화를 일으키고 있는 인공지능 기술을 접목한 인지시스템의 시장성, 인공지능형 디지털 데이터 분석 기술과 디지털 증거 능력 및 신뢰성 검증을 위한 인공지능 기술과 디지털 포렌식에 대해 설명한다.
인공지능 기술과 보안 이슈
(1) 정보보안 영역의 인공지능 활용 분야
인공지능 기술과의 융합을 통해 새로운 정보보안 위협에 대응하고, 선제적으로 정보보안 기술이 구현되고 있다. 이를 간단히 요약하면 다음과 같다[2][3].
- 빅데이터 기술과의 융합을 통한 침해 사고 예방 역량 강화
- 강력한 컴퓨팅 기능을 가진 인공지능 기술 활용
- 방대한 보안 위협 정보를 분석하는 빅데이터 기술과의 융합
- 머신러닝을 통한 보안 시스템 공격자의 다양한 행동 패턴 학습
- 인공지능 보안 시스템의 정확한 대응능 력 제고
- 머신러닝을 통한 기업 및 공공기관의 보안 시스템 역량 강화
- 국가 수준 및 글로벌 수준의 보안 위협 정보 공유
- 보안 시스템의 학습 능력 극대화
이러한 기술 구현을 통해 침해 사고 예방 역량을 강화할 필요가 있다. 그러나 아직 보안 시스템 역량 강화 수준은 기대에 미치지 못하고 있는바, 글로벌 수준의 보안 위협 정보 공유를 통해 정확하게 대응할 수 있는 공유 체계를 구축할 필요가 있다.
전통적인 범용의 정보보안 영역에서 인공지능 기술을 활용하여 새로운 보안기술 패러다임을 변화시켜가고 있다. 이를 간단히 요약하면 <표 1>과 같다.
▲ 표 1. 인공지능 기술을 활용한 새로운 보안기술
(2) 인공지능 도입과 기술 개발 이슈
2016년 3월 이세돌 9단과 알파고의 바둑 대국 이벤트를 계기로 인공지능(AI)에 대한 연구가 활발하게 진행되고 있다. 특히 정보보안 분야 주요 학회 등을 중심으로 보안 관제, 위협 탐지 및 예방 등 정보보안 목적을 달성하기 위한 기계학습, 딥 러닝 등의 인공지능 기술에 관한 논의가 활발히 이루어지고 있다.
그러나 방대한 데이터의 실시간 축적, 새로운 보안 위협 정보의 생성, 패턴 분석의 어려움 등 대응하기 어려운 상황에 직면하고 있다.
머신러닝, 딥 러닝 등 인공지능 기술의 도입을 통해 보안 위협의 탐지, 분석, 대응 등 주요 보안 임무를 자동화함으로써 보안 침해 사고에 효과적으로 대응이 가능할 것이다[2][3]. 국내 정보보안 솔루션 업계의 인공지능 기술 도입을 통한 기술 개발 내용을 <표 2>에 나타낸다.
▲ 표 2. 인공지능 도입을 통한 기술 개발 내용
기업 및 공공기관 등의 보안담당자 2,298명을 대상으로‘IoT 시대에 가장 시급히 필요한 보안대책은 무엇일까?’라는 설문조사 결과, 846명(전체의 31.10%)이 ‘인공지능(머신러닝)을 이용한 보안솔루션 상용화’를 선택하였다[4].
이는 정보보안 분야에 인공지능 기술의 활용이 활발해지면서 나타난 결과이기에 더욱 관심이 높다. 보안 솔루션 업계는 머신러닝, 딥 러닝 등 인공지능 기술 도입에 주력하고 있다.
인공지능 기술을 접목한 인지시스템의 시장성
(1) 시장 개요
인공지능 기술이 빅 데이터 및 클라우드 시스템과 접목되면서 비정형 데이터의 정보처리 및 정보분석 기술시장에 획기적인 변화가 일어나고 있다.
이로 인해 전 세계 소비자와 지식산업 연구 인력들에게 지능형 지원(intelligent assistance)을 제공할 수 있는 새로운 툴이 갖춰지게 됐다.
즉, 인지 가능 솔루션이 인지 소프트웨어 플랫폼 기반으로 개발 및 구축되면서 비정형/반정형 정보로부터 지식 베이스(knowledge bases)와 지식 그래프(knowledge graphs)를 구축하고 머신 러닝, 인공지능, 딥 러닝을 이용하여 예측, 권고, 지능형 지원을 제공할 수 있게 된 것이다.
지역적으로는 북미(미국과 캐나다) 지역이 예측 기간(2015~19) 동안 글로벌 인지시스템 시장의 80%를 차지하면서 인지시스템 지출이 가장 크고, 유럽/중동/아프리카(EMEA) 지역이 두 번째로 큰 것으로 나타났다.
향후 예측 기간 말(2019년 말)에는 일본을 포함한 아시아/태평양 지역이 유럽/중동/아프리카 지역을 추월할 것으로 예상하고 있다[5][6].
(2) 인지시스템 글로벌 시장 추이
인지시스템(cognitive systems) 관련 글로벌 시장 규모(지출 기준)는 2015년 172억 1,500만 달러에서 연평균 55%의 높은 성장을 지속하여 2019년에는 313억 달러의 대규모 시장을 형성할 것으로 예상하고 있다5).
2019년 기준으로, 가장 빠른 시장 성장이 예상되는 기술 분야는 인지 애플리케이션(cognitive application)으로 134억 달러 규모가 될 것으로 예상하고 있다. 뱅킹 부문과 소매 및 의료 부문을 합한 인지시스템 시장 규모는 100억 달러로 예상하고 있다[5][6]. 2015~19년의 인지시스템 관련 글로벌 시장 추이를 <표 3>에 나타낸다.
▲ 표 3. 인지시스템 글로벌 시장 추이
2015~19년의 인지시스템 시장의 세부 기술 점유율은 머신러닝/검색/시각화 등의 인지 애플리케이션과 인지 가능 솔루션 등의 인지 SW 플랫폼 기술이 40%, 뱅킹 부문은 20%6), 소매 및 의료 부문이 10%7), 기타 부문이 30%로 나타났다[5][6](표 4 참조).
▲ 표 4. 인지시스템 글로벌 시장의 기술 점유율(2015~19)
인공지능 기술과 디지털 포렌식
(1) 인공지능형 디지털 데이터 분석 기술
인공지능 기술이 접목된 인지시스템에 대한 지능형 공격의 대응 개념은 보안사고 이후의 디지털 포렌식(Digital Forensics)8)에 따라 초기 네트워크 침입이 인적 실수나 잘못된 네트워크 설계 요인을 밝혀내는 것이다.
아울러 공격 유형이 프로파일과 일치하건 멀웨어를 이용한 특정 해커의 소행이건 가장 중요한 것은 모든 네트워크가 동일한 단일 객체가 아니라는 점을 이해하는 것이 중요하다[7]9).
디지털 포렌식에 사용되는 데이터들을 효과적으로 분석하기 위해서는 증거 수집 및 보관, 증거 복구, 증거 분석 등 전 과정을 통해 저장 매체, 파일 시스템, 데이터 처리, 네트워킹 등 ICT 기술력 기반의 기초 연구가 필수적이다.
특히 악성코드 등을 이용한 지능적인 사이버 범죄에 대응하기 위해서는 신속한 복구와 아울러 사고의 원인 규명을 통한 예방책을 마련할 수 있어야 한다.
아울러 디지털 데이터를 분석하여 법적 요건에 충실한 디지털 포렌식 기술을 구현하기 위해서는 이미지 파일 카빙(File carving)과 같은 소프트웨어 포렌식 기술 개발이 필요하다[8].
(2) 증거 능력 및 신뢰성 검증
디지털 자료가 증거로 채택됐다는 것은 진정성과 무결성이 보장되는 증거 능력(admissibility)과 증명력(weight)이 인정되었다는 것이다.
디지털 증거의 요건을 충족하기 위해서는 논리적이고 체계화된 디지털 증거 수집 절차, 신뢰성 있는 디지털 포렌식 도구의 이용, 증거 분석관의 자격 검증, 합리적인 표준 절차가 필요하다.
아울러 디지털 포렌식 도구의 적합성을 검증하기 위해서는 각 절차마다 사용되는 도구에 대해 기능적 요구사항을 정의하고 적합성 테스트를 거쳐 신뢰성을 검증할 필요가 있다.
미국의 경우 Daubert Test와 같은 과학적 증거 판별기준을 정하여 디지털 포렌식 도구가 디지털 증거의 무결성을 보존하면서 유효한 결과물을 산출할 수 있는지 검증하고 있다.
국내에서는 2007년 TTA에서 디지털 포렌식을 위한 수집도구 검증을 위한 요구사항을 표준화한 바 있다[9][10].
결언
IoT 시대의 도래로 새로운 정보보안 대책 마련이 요구됨에 따라, 학계 및 보안 업계에서는 인공지능 기술이 결합된 보안기술에 대한 연구가 활발히 이루어지고 있다. IoT 시대의 본격화로 인해 사람, 기기, 데이터 간에 생성되는 정보가 클라우드 컴퓨팅 및 빅 데이터 기술 등을 통해 편리성과 효율성을 제고하고 있다.
동시에 방대한 양의 위협 정보가 생성되고 새로운 기술을 사용한 사이버 공격 또한 증가하고 있어 실시간 분석과 아울러 능동적으로 대응할 수 있는 새로운 정보보안 대책을 마련할 필요가 있다.
이에 보안 침해 사고에 대한 예방 및 대응 역량을 제고하기 위해 빅데이터, 클라우드 컴퓨팅 등 신기술과 인공지능 기술의 융합이 필요하다.
인공지능 기술이 접목된 인지시스템(cognitive computing system) 기술이 확산되면서 인지 가능 애플리케이션 및 인지 SW 플랫폼 시장이 빠르게 성장하고 있다. 2015년을 기점으로 2019년까지 이 분야에 대한 글로벌 ICT 기업들의 투자가 가속화될 것으로 예상된다.
인지시스템의 높은 활용 잠재력은 매우 다양한 분야에 활용되어 근로자와 기업들의 더 많은 정보 획득과 자동화 트렌드를 가속시킬 수 있을 것으로 예상된다. 인공지능 기술이 접목된 인지 네트워크를 통한 사이버 범죄로부터 정보를 보호하기 위해서는 정교한 공격 전략이나 숫자 게임10) 등을 통해 해커의 목표 네트워크에 대한 액세스 기법을 탐지하는 것이 매우 중요하다.
여기에는 지능형 위협 요인에 대한 방어를 위한 분석과 디지털 포렌식 기법이 모두 포함된다. 어떤 공격이든 네트워크 침입에서부터 시작되기 마련이다. 따라서 처음에는 멀웨어의 네트워크 침투 지점을 막는 데 집중해야 한다. 이것이 네트워크 방어를 무력화하려는 시도를 차단하는 예 방단계의 역할임을 인식할 필요가 있다.
-----------------------------------------
1) 알파고는 2015년에 유럽 챔피온 판 후이(Fan Hui)와의 대국에서 5:0으로 승리한 바 있다.
2) 구글, 애플, IBM, 마이크로소프트 등 글로벌 ICT 기업들은 양적으로 증가하고 있는 인텔리전스를 자사에서 개발한 디지털 시스템에 구축하여 정보의 검색뿐만 아니라 자문서비스까지 제공할 수 있는 이른바 개인비서(personal assistant) 서비스를 제공하고 있다.
3) 세일즈포스는 곧 자사의 시스템이 딥 러닝 알고리즘을 기반으로, 세일즈 담당자 및 콜센터 에이전트들에게 고객들로부터 수익 극대화를 얻기 위해 실행해야 하는 최고의 전략(할인 혜택, 상향 판매(up-sell) 유도, 저비용의 장기간 계약 등)이 무엇인지를 조언해 주고 있다.
4) 개인 고객과 고객센터 상담원 간에 실시간 및 최적화된 페어링을 제공함으로써 대형 기업들의 수익 극대화에 기여하고 있다.
5) 이러한 시장 규모는 기존의 인지 소프트웨어 시장 전망 조사 결과에 인지 컴퓨팅 관련 하드웨어와 서비스 지출을 포함한 것이다. IDC는 인지 컴퓨팅(cognitive computing), 사물인터넷(IoT), 차세대 데이터 보안, 3D 프린터, 로보틱스, 증강·가상현실을 6가지 혁신 기술로 꼽고 있다.
6) 금융사기 분석 및 조사, 프로그램을 통한 자문과 권고분야가 인지시스템 성장을 주도할 것으로 예상된다.
7) 소매 부문은 대부분 자동화 고객 서비스가 대표적이다. 의료 부문의 주요 사용 사례로는 진단 및 치료 시스템이 대부분을 차지하고 있다,
8) 다양한 디지털 기기에 남아있는 디지털 증거를 범 죄수사의 법적 증거로 인정받기 위해서 획득/보관/분석/제출 과정에서 위변조되지 않도록 하여 무결성(Integrity), 정당성(Legitimacy), 재현성(Reproducibility), 연계 보관성(Chain of Custody), 원본성(Originality) 및 증거 능력(Admissibility) 등을 보장할 수 있는 과학 수사 기법을 의미한다. 즉, 과학 수사에서 범죄 사실을 증명할 수 있는 디지털 증거물을 과학적으로 조사하는 과정을 의미한다.
9) 대부분의 네트워크는 여러 곳에 분산되어 있는 기술의 집합체이기 때문에 인적 요인뿐만 아니라 이 두 가지 요인은 바로 네트워크의 방어 능력을 잠재적으로 약화시킬 수 있는 취약점이 될 수 있다.
10) 숫자 게임이란 많은 네트워크에 멀웨어를 침투시켜 놓고 보면 결국 침입 경로를 발견할 수 있는 것을 말한다.
박세환 _ 한국과학기술정보연구원 전문연구위원
Copyright ⓒ 첨단 & Hellot.net