미디어젠은 한국전자통신연구원(ETRI)의 연구 인력 현장 지원 프로그램을 통해 기존에 음성 스펙트럼 채널이 1개인 것을 보완해 RGB 3채널을 이용한 음성 스펙트럼을 개발했다고 21일 밝혔다. 현재 가장 널리 사용되는 음성 인식 특징은 '로그 멜 스펙트럼'이지만, 이 특징은 음성 신호의 다양한 생성 과정을 포함하지 못한다는 단점이 있다. 또 심층 학습망의 특성상 입력이 되는 특징이 다양한 음성의 특징적 요소를 각각 표현해줄 수 있어야 이를 바탕으로 더 지능적인 학습을 진행할 수 있다. 이에 따라 미디어젠은 ETRI 연구 인력 현장 지원 프로그램을 통해 음성 발성 모델을 활용, 분석된 성도 필터 정보와 신호 정보를 채널화함으로써 RGB 구성 요소를 갖는 컬러 스펙트럼을 개발했다. 일반적으로 성도 필터 정보는 음소를 표현하기에 적합하며 배경 잡음에 상대적으로 강인한 특성이 있고, 신호 정보는 음성 정보뿐만 아니라 발성 개인의 특성을 잘 표현해주는 특성이 있다. 컬러 스펙트럼에서는 이런 정보를 분석한 뒤 특징화해 음성 인식 시스템을 학습할 때 이를 심층 학습망에 알려줌으로써 인공지능이 음성 인식에 필요한 특징 정보를 선택하도록 도움을 준다. 이를 증명하기 위해 수
앤비젼이 REVOX 조명 시리즈 신제품을 출시했다. 비전 시스템에서 검출력을 극대화하는 방법 중 하나는 적절한 조명 선택이다. 고배율, 고속으로 갈수록 고성능 조명을 사용하는 것은 선택이 아닌 필수다. 앤비젼의 궁극의 초고휘도 LED 광원 REVOX 시리즈 특징은 ▲장비 간 편차를 줄일 수 있는 밝기 선형성(Linearity) ▲광량을 지속적으로 유지하는 피드백 시스템 ▲한 소스에서 RGB 개별 제어가 가능한 SLG-450TSL ▲근적외선 영역대(NIR) 조명으로 안 보이는 영역대의 검출력 향상 등이다. REVOX의 전제품은 최대 5개의 밝기 설정값에 따른 실제 밝기를 측정하여 출력을 보정한다. 최소 출력과 최대 출력, 선형 보정 등 Factory calibration을 통해 여러 대 사용 시 동일한 조명 밝기를 보장하여, 장비 간 편차를 줄일 수 있다. 또한 최대 30,000 시간까지 초기 광량을 유지할 수 있도록 Illuminator 내부에 측정 및 보정 기능을 탑재하고 있다. 이를 통해 오랜 시간 동안 변하지 않는 안정적인 밝기를 제공한다. Revox의 SLG-450TSL 모델은 R/G/B LED 개별 밝기 제어가 가능한 Illuminator이다. 고효