データ不足の状況下でも、大規模言語モデルを活用して生成したテキストプロンプトと、適応的なガイダンス重み調整により、Diffusion Modelを用いて多様かつ目的分布に沿った合成画像を生成することができる。
SAFLEXは、既存のデータ拡張手法に後処理として適用することで、拡張データのサンプル重みとソフトラベルを自動的に学習し、モデルの汎化性能を向上させる効率的な手法である。
本稿では、マスク言語モデルと文埋め込みを用いて、既存の対訳コーパスから質の高い新しい対訳文を自動生成し、コーパスを拡張する手法を提案する。
ラベル付けされた心臓聴診信号データの不足を克服するために、従来の音声処理手法と拡散モデル(WaveGradとDiffWave)を用いた条件付き合成音声生成を組み合わせたデータ拡張手法が提案されており、これにより、異常心音分類器のロバスト性(in-distributionおよびout-of-distribution性能)が向上することが示されています。
深層学習モデルの頑健性と汎化能力を向上させるために、サンプルごとに異なる強度で意味的かつ反事実的に意味のある深い特徴を生成する、暗黙的反事実データ拡張(ICDA)と呼ばれる新しいサンプルワイズデータ拡張手法が提案されています。
状態ベースの連続制御タスクにおいて、ユークリッド対称性に基づくデータ拡張を用いることで、強化学習アルゴリズムのデータ効率と漸近性能を大幅に向上させることができる。