Core Concepts
Huber損失を使用して拡散確率モデルを訓練する可能性について調査しました。時間依存型のδパラメーターに関する十分な条件を示し、データセットの破壊と取り組む際にHuber損失が有用であることを示しました。
Abstract
この論文では、拡散確率モデルの訓練にHuber損失を使用する可能性について調査しました。主な貢献は以下の通りです:
時間依存型のδパラメーターを導入することで、新しいテクニックであるdelta-schedulingを提案しました。
複数のデータセットおよびモダリティでアプローチの効果を実験的に実証しました。
さまざまなスケジュール、擬似ヒューバー損失パラメータ、汚染割合、および耐久性係数計算に関する詳細な研究を行いました。
1. Abstract:
拡散モデルはトレーニングデータ内の外れ値に対して脆弱であることが知られています。
本稿では、外れ値に強くかつ高品質な生成されたデータを保持しつつも外れ値に堅牢な代替拡散損失関数に焦点を当てます。
2. Introduction:
ディフュージョン確率モデルはさまざまな生成タスクで優れた結果を達成しています。
テキストから画像や音声への変換など多岐にわたるタスクで利用されています。
3. Experiments:
テキストから画像へのカスタマイズ実験では、異なる汚染レベルごとに3つの異なるモデルがトレーニングされました。
同様に、テキストから音声へのシナリオでも複数の話者用データセットが作成されました。
4. Limitations and Future Work:
完全なデータセットが攻撃された場合はこの手法がうまくいかない可能性があります。
Huber lossがロバストなモデル適応条件に適している可能性についてより正確な条件特定が必要です。
Stats
拡散確率モデルはトレーニングデータ内の外れ値に対して脆弱であることが知られています。
外れ値や汚染サンプルへ対処するため、Huber loss関数やPseudo-Huber loss関数が提案されています。