셀렉트스타 황민영 부대표 인터뷰 AI 모델이 발달함과 동시에 높아지는 가치가 있으니 바로 데이터다. 데이터 품질은 곧 AI 성능을 대변한다. 좋은 품질의 데이터는 일관성 있는 패턴과 신뢰성을 보장하며, 그렇지 못한 데이터는 오류와 불일치로 점철돼 AI에 악영향을 끼친다. 그렇기에 데이터 수집·관리 및 분석은 AI 프로젝트의 핵심이다. ‘데이터 센트릭 AI’를 선포한 셀렉트스타는 데이터의 중요성을 간파하고 AI 학습 데이터의 기준을 만들고 있다. 이에 셀렉트스타 황민영 부대표를 만나 셀렉트스타가 가진 데이터 비전과 비즈니스 전략에 대해 이야기 나눠봤다. ‘데이터 센트릭’이라는 아이덴티티 똑똑한 AI 모델이 되기 위해서는 데이터 품질이 보장돼야 한다. 특히 데이터의 정확성은 AI 모델이 올바른 패턴을 학습하기 위한 필수 전제조건이다. 그렇지 않을 경우 오류와 거짓을 범하는 불량스러운 AI 모델이 만들어질 뿐이다. 모델을 훈련시키기 전에 데이터 품질을 검토하고 개선하는 것은 그만큼 중요한 작업이다. 오늘날 기업은 고품질의 데이터를 확보하는 것을 우선과제로 삼는다. 보통은 필요한 데이터의 양이나 품질이 충분하지 않고, 데이터가 특정 편향을 갖는 사례가 많다. 또한,
다운로드 270만건 이상의 크라우드소싱 플랫폼 ‘캐시미션’ 운영사 셀렉트스타가 2022년 1월 5일부터 8일까지 미국 라스베이거스에서 개최되는 CES 2022에 참가한다. 셀렉트스타는 CES 2022에서 자사의 인공지능 데이터 학습데이터 플랫폼을 선보일 예정이다. 셀렉트스타의 인공지능은 비슷한 데이터를 자동으로 필터링함으로써 데이터 수집과 가공을 효율적으로 제공하는 것이 특징이다. 셀렉트스타는 누적 다운로드 270만건 이상의 크라우드소싱 플랫폼 ‘캐시미션’을 운영하고 있는 스타트업이다. 창립 3년만에 연 매출 60억원을 돌파했으며, 현재까지 유치한 투자 금액은 누적 40억원에 이른다. 성장 배경에는 카이스트 박사진이 개발한 셀렉트스타만의 수학적 알고리즘이 있다. 알고리즘을 적용한 ‘캐시미션’을 활용해 인공지능이 수집한 데이터가 현재 100만건에 달한다. 이는 지금까지 약 200개 기업이 셀렉트스타를 이용한 결과다. 셀렉트스타를 이용했던 롯데정보통신은 “대량의 OCR 데이터 가공을 내부 파트타임을 고용했을 경우 6개월이 걸리는데 셀렉트스타는 1개월만에 처리해서 제공했다”며 “비용, 품질, 속도 등 모두 만족스러웠다”고 말했다. 셀렉트스타 김세엽 대표는 “셀렉