VUNO Inc.

press releases

뷰노, 딥러닝 학습용 음성데이터셋 변환기술 논문 국제 저명 학회지 게재

  • 2019. 02. 14

○ 국내 벤처기업이 인공지능 딥러닝 학습효과가 개선된 음성변환 모델 개발에 성공하였다.

 ○ 인공지능(AI) 헬스케어 업체 뷰노는 자체 개발한 인공지능 음성인식을 위한 음성변환 모델관련 논문이 음성 신호처리 분야 국제 저명 학회지인 ICASSP  등재되었으며오는 5 학회에서 발표될 예정이라고 12 밝혔다.

 ○ 인공지능 딥러닝 기법은 많은 양의 다양한 데이터를 학습시킬수록 성능이 더욱 좋아지게 된다하지만 현실적으로 학습데이터를 새로 수집하는 데에는 많은 시간과 인력그리고 재원이 들어가는 한계점이 있으므로 이를 해결하기 위하여 현재 보유한 학습데이터를 변환하여 새로운 데이터를 늘리는 “데이터 증강 기법 사용하게 된다.

 ○ 이는 음성인식에도 마찬가지인데 새로운 음성데이터셋 음성과 텍스트가 쌍을 이루고 있는 데이터를 모으기보다는 기확보한 음성데이터를 다양한 방법으로 변환하여 사용하는데기존의 변환기술로는 음의 높낮이 변화나 노이즈 많은 부분이 닮아 있어 학습데이터로서 가치가 제한적이었다.

 ○ 뷰노는 자체 개발기술로 기존의 변환기법에 부가하여 언어특징과 음성 아이덴티티를 이용하는 기법으로 새로운 특징을 갖는 음성데이터로 변환하는데 성공하였다이는 적은 양의 데이터셋으로도 충분한 학습 데이터를 생성할 있어 인공지능 딥러닝에 기여를 하게 되며실제 벤치마크 데이터인 Wall Street Journal 실험한 결과 최종 인식 성능이 드라마틱하게 개선된 결과를 확인하였다.

 ○ 이번 연구를 주도한 뷰노의 왕지성 연구원은 “국내 음성인식 개발환경에서는 영어권과는 달리 기구축된 한국인 음성 데이터셋이 제한되어 있다이번 개발기술로 다양한 음성데이터셋을 생성할 있어 음성인식 성능이 비약적으로 향상될 것으로 기대된다. ”  밝혔다.

 ○ 실제 뷰노는 기술을 적용한 의료기록 음성인식 솔루션을 이대목동병원과 함께 성공적으로 개발을 완료하였고현재 이대목동병원을 비롯한 다수 병원에서는 소프트웨어를 사용하여 전사 업무에 활용하고 있으며또한 다양한 분야로 확장을 추진하고 있다

Tag in

#press_releases

#VUNO Med®-Deep ASR™