核心概念
ラベル比率からのOR関数学習は定数節CNFでは困難であり、また一般のt-DNFでも1/2以上の精度を達成するのは困難である。さらに、パリティ関数の学習も指数的に困難になる。
要約
本論文では、ラベル比率からのブール関数学習の困難性について分析している。
主な結果は以下の通り:
ラベル比率がORに一致する2サイズ以下のバッグが与えられた場合、定数節数のCNFで少なくとも一定割合のバッグを満たすのは NP困難である。これは、ORをハーフスペースで学習する場合の近似アルゴリズムとの対照的な結果である。
同様のバッグ集合に対して、t-DNFで1/2以上の精度で満たすのも NP困難である。これは、ノイズありのORの学習でのみ知られていた1/2近似の困難性が、ノイズなしのORの学習にも成り立つことを示している。
パリティ関数の学習についても、バッグサイズqに対して、qの指数関数的に近い割合のバッグしか満たせないことを示した。一方で、ランダムなパリティ関数ベースのアルゴリズムでは1/2q-2の近似が可能である。
これらの結果は、ラベル比率学習の枠組みにおいて、ブール関数の学習が通常のPAC学習とは大きく異なることを示している。
統計
ラベル比率が一致するバッグの割合が1/2以上になるのは NP困難である。
ラベル比率が一致するバッグの割合が q/2q-1 + o(1) 以上になるのは NP困難である。