Core Concepts
半教師あり学習において、十分な量の教師なしデータがある場合、教師あり学習に比べて教師データの量を大幅に削減できることを示す。この削減は、異なる複雑性尺度によって特徴付けられる。
Abstract
本論文は、敵対的に堅牢なPAC学習の半教師あり学習モデルを研究している。敵対的な攻撃に対して耐性のある予測器を学習するために必要な教師データと教師なしデータの量を明らかにすることが目的である。
主な結果は以下の通り:
十分な量の教師なしデータがある場合(完全教師あり学習に必要な量と同程度)、教師データの量を従来の手法に比べて任意に小さくできることを示した。この教師データ量は、異なる複雑性尺度であるVCUによって特徴付けられる。
VCUとRSUの間には任意の隔たりがあり、VCUはRSUよりも小さくなる可能性がある。このことから、半教師あり学習では教師データ量を大幅に削減できることがわかる。
実現可能な場合、教師データ量はVCUに依存し、教師なしデータ量はRSUに依存する。一方、非実現可能な場合、教師データ量はRSUに依存し、教師なしデータ量はVCUに依存する。
適切学習では限界があり、不適切学習が必要になる場合があることを示した。これは完全教師あり学習の場合と同様である。
Stats
十分な教師なしデータがある場合、教師データ量はVCUに依存し、O(VCU/ε + log(1/δ)/ε)となる。
教師なしデータ量はRSUに依存し、O(RSU/ε + log(1/δ)/ε)となる。
非実現可能な場合、教師データ量はRSUに依存し、Ω(RSU/ε^2 + 1/ε^2 log(1/δ))となる。
Quotes
"半教師あり学習において、十分な量の教師なしデータがある場合、教師あり学習に比べて教師データの量を大幅に削減できる。"
"VCUとRSUの間には任意の隔たりがあり、VCUはRSUよりも小さくなる可能性がある。"
"適切学習では限界があり、不適切学習が必要になる場合がある。"