이 논문은 바이노럴 음성 향상(BSE) 문제를 다룹니다. BSE는 청취 장치에서 수신된 잡음 신호의 음질과 명료도를 향상시키면서 대상 음원의 공간 단서를 보존하는 것을 목표로 합니다. 기존 방법들은 잡음 감소 능력과 공간 단서 보존 정확도 간의 타협, 복잡한 음향 환경에서의 높은 계산 요구량 등의 문제가 있었습니다.
이 논문에서는 경량 바이노럴 복소 합성곱 신경망(LBCCN)을 제안합니다. LBCCN은 저주파 대역을 필터링하고 나머지 대역은 그대로 유지함으로써 잡음 감소 성능을 높이면서도 계산 복잡도를 크게 낮출 수 있습니다. 또한 상대 음향 전달 함수 추정을 통해 공간 단서 충실도와 음성 명료도를 보장합니다.
실험 결과, LBCCN은 다양한 잡음 환경에서 최신 기법들과 비교할만한 잡음 감소 성능을 보이면서도 훨씬 낮은 계산 비용과 더 나은 공간 단서 보존 능력을 보여줍니다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor