Core Concepts
データ連続学習では、標準的なハイパーパラメータ最適化手法を適用できないため、データ連続学習に特化したハイパーパラメータ最適化フレームワークが必要とされている。本研究では、様々な現実的なハイパーパラメータ最適化フレームワークを評価し、計算効率が高く実用的な第一課題ハイパーパラメータ最適化が優れた性能を発揮することを示した。
Abstract
本論文では、データ連続学習におけるハイパーパラメータ最適化フレームワークについて検討している。
データ連続学習では、学習者がデータストリームを一度しか見られないため、標準的なハイパーパラメータ最適化手法を適用できない。そのため、データ連続学習に特化したハイパーパラメータ最適化フレームワークが必要とされている。
本研究では、以下のようなハイパーパラメータ最適化フレームワークを評価した:
固定フレームワーク
終了時ハイパーパラメータ最適化: 全データストリームを使って最適なハイパーパラメータを見つける。ただし、現実的ではない。
第一課題ハイパーパラメータ最適化: 最初の課題のみを使ってハイパーパラメータを最適化する。計算効率が高く現実的。
動的フレームワーク
現在課題ハイパーパラメータ最適化: 現在の課題のバリデーションデータを使ってハイパーパラメータを最適化する。
過去課題ハイパーパラメータ最適化(メモリ): 現在の課題のバリデーションデータと過去課題のメモリバッファからサンプリングしたデータを使ってハイパーパラメータを最適化する。
過去課題ハイパーパラメータ最適化(バリデーション): 現在の課題のバリデーションデータと過去課題のバリデーションデータを使ってハイパーパラメータを最適化する。
実験の結果、これらのハイパーパラメータ最適化フレームワークはいずれも同程度の性能を発揮することが分かった。そのため、計算効率が高く実用的な第一課題ハイパーパラメータ最適化を推奨する。
Stats
データ連続学習では、学習者が一度しかデータストリームを見られないため、標準的なハイパーパラメータ最適化手法を適用できない。