Core Concepts
画像のリアルさを定量化することは、機械学習において重要であり、普遍的な批評家の概念が有用である。
Abstract
過去10年間で、現実的なデータ(画像、テキスト、音声、ビデオ)を生成する能力が大幅に向上しています。本稿では、現実性を定量化し、つまり現実的なデータと非現実的なデータを確実に区別できる関数を設計する問題に焦点を当てます。この問題は解決が非常に難しく、最近の生成AIの突破にもかかわらず、理解度が低いままです。アルゴリズム情報理論から得られた洞察を活用し、この問題がなぜ難しいのか、良い生成モデルだけでは解決できない理由、そして良い解決策がどのように見えるかについて議論します。特に、敵対的批評家とは異なり敵対的トレーニングを必要としない「普遍批評家」の概念を紹介します。普遍批評家は直ちに実用的ではありませんが、実践的な実装を導く北極星として役立ちます。
Stats
画像や他の感覚データの広範囲の欠陥を検出する人間。
現実的なデータxが生じた場合低い値U(x) を生成する実数関数U。
潜在的な応用:異常検知やDeepfake検出。
データ分布Pから抽出された任意長または他種類のデータ。
Quotes
"人間はさまざまな欠陥を画像や他の感覚データで検出できます"
"教師無し異常検知では一般的に異常値として定義される"
"確率密度は通常最大化されることが多く"
"弱典型性は現象学者でもある"
"普遍批評家は敵対トレーニング不要"