本研究は、オフポリシー評価(OPE)手法の脆弱性を初めて調査したものである。OPEは医療や金融などの高リスク分野で重要な役割を果たすが、攻撃的なデータ改変に対する耐性は十分に理解されていない。
本研究では、影響関数を用いた新しいデータ毒害攻撃フレームワーク「DOPE」を提案した。DOPEは、わずかなデータ改変によってOPE手法の推定値に大きな誤差を生み出すことができる。
実験では、5つのOPE手法(BRM、WIS、PDIS、CPDIS、WDR)に対してDOPEを適用した。その結果、BRM、PDIS、WDRは攻撃に非常に脆弱であり、CPDISとWISがより堅牢であることが示された。例えば、HIVドメインでは、わずか5%のデータ改変によって、BRMの推定値に340%以上の誤差が生じた。
これらの結果は、OPE手法の信頼性に疑問を投げかけるものであり、攻撃に強いOPE手法の開発の必要性を示唆している。
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Elita Lobo,H... : arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04714.pdfDaha Derin Sorular