본 연구는 성별 모호성을 가진 음성 생성을 위한 새로운 접근법을 제시한다. 기존 연구에서는 음높이 변환 등 음향적 특징 변화에 초점을 맞추었지만, 본 연구에서는 말투 전이를 통해 성별 모호성을 높이고자 하였다.
구체적으로, 여성 음성을 남성 음성으로 음성 변환하되 여성적 말투를 유지하는 방식을 사용하였다. 이를 통해 음높이 변환만으로는 달성하기 어려운 수준의 성별 모호성을 달성할 수 있었다.
연구진은 성별 모호성 평가를 위한 명확한 정의와 평가 프레임워크를 제시하였다. 이를 통해 청취자의 성별 인식, 확신도, 놀라움 등을 종합적으로 평가하였다. 실험 결과, 제안 방식으로 생성된 음성이 높은 수준의 성별 모호성을 보였으며, 음질 또한 양호한 것으로 나타났다.
본 연구는 성별 모호성 음성 생성에 있어 말투 전이의 중요성을 처음으로 강조하였다는 점에서 의의가 있다. 또한 성별 모호성 평가를 위한 체계적인 프레임워크를 제시하였다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Maria Koutso... um arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07661.pdfTiefere Fragen