本論文では、線形回帰分析の中心的な話題である回帰分析の検証方法について提案している。
まず、最小二乗法(OLS)による線形回帰の基本的な枠組みを説明する。その上で、機械学習(ML)手法による回帰分析の課題として、統計的有意性の検討が不足していることを指摘する。
そこで、統計的学習理論(SLT)に基づいて、期待損失の上限を用いて回帰モデルの有意性を検証する「統計的無関係回帰(SAR)」手法を提案する。
具体的には、MLモデルの期待損失を、説明変数と目的変数が無相関の場合の期待損失と比較し、前者が後者を下回る場合に、モデルの有意性を認める、という方法である。
様々な合成データや実データを用いた実験により、SARの有効性を示す。特に、サンプルサイズが小さい場合や、データが非ガウス分布に従う場合に、SARが優れた性能を発揮することを確認した。
また、異分散性の検出にもSARが有効であることを示した。
以上より、SARは、MLによる回帰分析の有意性検証に有用な手法であると結論付けられる。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問