Papers

차량환경에서 음성인식 성능 향상을 위한 마이크로폰 어레이 빔형성 기법

Domestic Journal
~2005
작성자
한혜원
작성일
2005-10-01 00:31
조회
220
Authors : 한철희, 강홍구, 황영수, 윤대희

Year : 2005

Publisher / Conference : 한국음향학회지

Volume : 24, 제 7호

Page : 423-430

본 논문에서는 차량환경에서 잔향과 근접장 효과에 의해 발생하는 목적 음성 신호의 왜곡을 감소시킬 수 있는 마이크로폰 어레이 빔형성 기법을 제안하였다. 온라인으로 추정하기 어려운 소스와 마이크간의 전달함수 대신 상대적으로 추정이 용이한 기준 마이크와 다른 마이크간의 상대전달함수를 조향 벡터로 이용함으로써, 원격장 모델의 조향 벡터를 이용한 빔형성기에 비해 목적 음성 신호의 왜곡을 감소시킬 수 있는 준최적 빔형성 기법을 제안하였다. 제안된 방법의 성능을 검증하기 위해, 실제 차량에서 녹음된 음성 DB를 구축하고, 이를 이용하여 HTK를 통한 음성인식 실험을 수행하였다. 음성인식 실험 결과 원격장 모델을 이용한 방법보다 인식률이 최대 15%까지 향상됨을 확인하였다.
전체 319
319 International Conference Jinyoung Lee and Hong-Goo Kang "Stacked U-Net with High-level Feature Transfer for Parameter Efficient Speech Enhancement" in APSIPA ASC, 2021
318 International Conference Huu-Kim Nguyen, Kihyuk Jeong, Se-Yun Um, Min-Jae Hwang, Eunwoo Song, Hong-Goo Kang "LiteTTS: A Decoder-free Light-weight Text-to-wave Synthesis Based on Generative Adversarial Networks" in INTERSPEECH, 2021
317 International Conference Zainab Alhakeem, Yoohwan Kwon, Hong-Goo Kang "Disentangled Representations for Arabic Dialect Identification based on Supervised Clustering with Triplet Loss" in EUSIPCO, 2021
316 International Conference Miseul Kim, Minh-Tri Ho, Hong-Goo Kang "Self-supervised Complex Network for Machine Sound Anomaly Detection" in EUSIPCO, 2021
315 International Conference Kihyuk Jeong, Huu-Kim Nguyen, Hong-Goo Kang "A Fast and Lightweight Text-To-Speech Model with Spectrum and Waveform Alignment Algorithms" in EUSIPCO, 2021
314 International Conference Jiyoung Lee*, Soo-Whan Chung*, Sunok Kim, Hong-Goo Kang**, Kwanghoon Sohn** "Looking into Your Speech: Learning Cross-modal Affinity for Audio-visual Speech Separation" in CVPR, 2021
313 International Conference Zainab Alhakeem, Hong-Goo Kang "Confidence Learning from Noisy Labels for Arabic Dialect Identification" in ITC-CSCC, 2021
312 International Conference Huu-Kim Nguyen, Kihyuk Jeong, Hong-Goo Kang "Fast and Lightweight Speech Synthesis Model based on FastSpeech2" in ITC-CSCC, 2021
311 International Conference Yoohwan Kwon*, Hee-Soo Heo*, Bong-Jin Lee, Joon Son Chung "The ins and outs of speaker recognition: lessons from VoxSRC 2020" in ICASSP, 2021
310 International Conference You Jin Kim, Hee Soo Heo, Soo-Whan Chung, Bong-Jin Lee "End-to-end Lip Synchronisation Based on Pattern Classification" in IEEE Spoken Language Technology Workshop (SLT), 2020