Core Concepts
バッチ正規化は、ビデオ学習において重要な問題を引き起こす可能性があります。
Abstract
バッチ正規化(BN)は、他のサンプルに依存する特性を持ち、シーケンシャルモデリングで問題を引き起こす可能性がある。手術ワークフロー分析では、事前学習された特徴抽出器の欠如が複雑なトレーニングパイプラインを生み出しています。BNの問題意識は効果的なエンドツーエンド学習に不可欠です。バッチ正規化を避けた単純なCNN-LSTMモデルが最先端技術を上回ることが示されました。
Stats
BNは小さなバッチサイズでうまく機能しない。
BNによって訓練とテスト間で不一致が生じる。
BNは連続したサンプルでも問題を引き起こす。
単一シーケンスバッチではBNベースのモデルが失敗する。
Quotes
"BN関連の問題意識は長いビデオ理解においても重要です。"
"BNフリーバックボーンを使用した単純なCNN-LSTMモデルが最先端性能を達成します。"