แนวคิดหลัก
参加者は、話者の音声を隠しつつ言語的内容と感情状態を保護する音声匿名化システムを開発する。
บทคัดย่อ
本文書は、音声匿名化チャレンジの課題、使用するデータやベースラインシステム、評価指標と手順について説明している。
- 課題は、話者の音声アイデンティティを隠しつつ言語的内容と感情状態を保護する音声匿名化システムを開発すること。
- 主催者は開発・評価用データセットと評価スクリプト、ベースラインシステム、トレーニングリソースを提供する。
- 参加者は自身で開発した匿名化システムを適用し、評価結果とアノニマイズされた音声データを提出する。
- 結果は2024年のInterspeechワークショップで発表される。
変更点:
- 話者の声の特徴と抑揚を保護する必要がなくなったため、関連する評価指標を削除。
- トレーニングデータとモデルのリストが拡張された。
- 評価プロトコルとスクリプトが大幅に簡素化された。
- 主観評価は行わず、客観的な3つの評価指標(EER、WER、UAR)を使用する。
สถิติ
話者ごとの登録発話数は、LibriSpeech開発セットで1,348、評価セットで997。
話者間の発話ペア数は、LibriSpeech開発セットで27,362、評価セットで20,653。