Grunnleggende konsepter
RoDia는 로마니아 내 5개 지역의 방언을 포함하는 최초의 음성 데이터셋으로, 이를 통해 향후 로마니아 방언 식별 연구를 촉진할 수 있다.
Sammendrag
RoDia는 로마니아 내 5개 지역(Muntenesc, Ardelenesc, Moldovenesc, Oltenesc, Bănățean)의 방언을 포함하는 최초의 음성 데이터셋이다. 2,768개의 오디오 샘플로 구성되어 있으며, 방언, 성별, 연령 정보가 수동으로 레이블링되어 있다. 실험 결과, 최고 모델이 62.08%의 micro F1 점수와 59.83%의 macro F1 점수를 달성하여, 로마니아 방언 식별이 쉽지 않은 과제임을 보여준다. 또한 기존 음성 인식 모델의 성능 평가를 통해 방언 음성 인식의 어려움을 확인하였다. RoDia는 향후 로마니아 방언 식별 연구를 위한 유용한 자원이 될 것으로 기대된다.
Statistikk
방언별 오디오 샘플 수: Muntenesc 709개, Ardelenesc 546개, Moldovenesc 590개, Oltenesc 400개, Bănățean 523개
방언별 신호 대 잡음비(SNR): Muntenesc 29.0dB, Ardelenesc 28.8dB, Moldovenesc 25.6dB, Oltenesc 26.6dB, Bănățean 23.1dB
방언별 신호 대 잔향비(SRR): Muntenesc 35.3dB, Ardelenesc 36.4dB, Moldovenesc 32.4dB, Oltenesc 31.2dB, Bănățean 34.6dB