Papers

화자 인식을 위한 적대학습 기반음성 분리 프레임워크에 대한 연구

Domestic Journal
2016~2020
작성자
한혜원
작성일
2020-09-01 02:12
조회
2018
Authors : 권유환, 정수환, 강홍구

Year : 2020

Publisher / Conference : 한국음향학회지

Volume : 39, 제 5호

Page : 447-453

본 논문은 딥러닝 기법을 활용하여 음성신호로부터 효율적인 화자 벡터를 추출하는 시스템을 제안한다. 음성 신호에는 발화내용, 감정, 배경잡음 등과 같이 화자의 특징과는 관련이 없는 정보들이 포함되어 있다는 점에 착안하여 제안 방법에서는 추출된 화자 벡터에 화자의 특징과 관련된 정보는 가능한 많이 포함되고, 그렇지 않은 비화자 정보는 최소화될 수 있도록 학습을 진행한다. 특히, 오토-인코더(atuo-encoder) 구조의 부호화 기(encoder)가 두 개의 임베딩 벡터를 추정하도록 하고, 효과적인 손실 함수 조건을 두어 각 임베딩이 화자 및 비화자 특징 만을 각각 포함할 수 있도록 하는 효과적인 화자 정보 분리(disentanglement)방법을 제안한다. 또한, 화자 정보를 유지하는데 도움이 되는 생성적 적대 신경망(GAN; Generative Adversarial Network)에서 활용되는 판별기 구조를 도입함으로써, 디코더의 성능을 향상시킴으로서 화자 인식 성능을 보다 향상시킨다. 제안된 방법에 대한 적절성과 효율성은 벤치마크 데이터로 사용되고 있는 Voxceleb1에 대한 동일오류율 (EER; Equal Error Rate)개선 실험을 통하여 규명하였다.
전체 355
44 Domestic Journal 권유환, 정수환, 강홍구 "화자 인식을 위한 적대학습 기반음성 분리 프레임워크에 대한 연구" in 한국음향학회지, vol.39, 제 5호, pp.447-453, 2020
43 Domestic Journal 오상신, 엄세연, 장인선, 안충현, 강홍구 "k-평균 알고리즘을 활용한 음성의 대표 감정 스타일 결정 방법" in 한국음향학회지, vol.38, 제 5호, pp.614-620, 2019
42 Domestic Journal Ji-ho Seo, Dae Hee Youn, Young-Cheol Park "A Method of Designing Low-power Feedback Active Noise Control Filter for Headphones/Earphones" in 한국통신학회논문지, vol.10, 제 1호, pp.57-65, 2017
41 Domestic Journal Hyeongi Moon, Young-cheol Park, Yong Ju Lee, Young-soo Whang "MPEG-H 3D Audio Decoder Structure and Complexity Analysis" in 한국통신학회논문지, vol.42, 제 2호, pp.432-443, 2017
40 Domestic Journal 문현기, 박영철, 황영수 "위상 일치와 가변 지수 감쇠 가중치 부여 방법이 적용된 가상 저음 시스템" in 방송공학회논문지, vol.21, 제 6호, pp.889-898, 2016
39 Domestic Journal 박영철, 이태규, 윤대희 "MPEG-H 3D 오디오 바이노럴 렌더링 기술 표준화" in 대한전기학회, 전기의 세계, vol.64, 제 2호, pp.27-31, 2015
38 Domestic Journal 오현오, 이태규, 전세운, 윤대희, 박영철, 서정일, 이용주 "모바일 3D 사운드 : 바이노럴 오디오 기술 동향" in 방송공학회논문지, vol.19, 제 1호, pp.65-74, 2014
37 Domestic Journal 현동일, 박영철, 윤대희 "파라메트릭 스테레오 오디오 부호화를 위한 향상된 위상 합성 기법" in 전자공학회논문지, vol.50, 제 12호, pp.184-190, 2013
36 Domestic Journal 이정인, 최정윤, 강홍구 "음성감정인식에서 음색 특성 및 영향 분석" in 방송공학회논문지, vol.18, 제 5호, pp.771-774, 2013
35 Domestic Journal 이정인, 강홍구 "음성감정인식에서의 톤 정보의 중요성 연구" in 방송공학회논문지, vol.18, 제 5호, pp.713-721, 2013