核心概念
深層学習モデルのアーキテクチャ設計は重要な課題であり、特に過剰なモデル深度は不要な計算コストを生み出す。CKA分析を用いることで、モデル深度の最適化と冗長な層の特定が可能となる。
要約
本研究では、リモートフォトプレチスモグラフィー(rPPG)のための深層学習モデルアーキテクチャの最適化を行った。
まず、既存のrPPGモデルであるPhysNet-3DCNNとTS-CANについて、層数を2層から15層まで変化させたバリアントを作成した。次に、これらのモデルに対してCentered Kernel Alignment (CKA)分析を行い、モデル間の層の類似性を調べた。
CKA分析の結果、PhysNet-3DCNNでは10層以降に冗長な層が追加されることが分かった。一方、TS-CANでは2層モデルが不十分であり、5層程度のモデルが最適であることが示唆された。
これらの分析結果は、実際の性能評価実験でも裏付けられた。PhysNet-3DCNNでは6層程度で十分な性能が得られ、それ以上の深度では大きな改善は見られなかった。TS-CANでは5層程度のモデルが最も良好な結果を示した。
以上より、CKA分析は深層学習モデルのアーキテクチャ最適化に有効であることが示された。本手法を用いることで、過剰なモデル深度を排除し、計算コストを削減しつつ高性能なrPPGモデルを構築できると考えられる。
統計
PhysNet-3DCNNモデルの深度が6層以上では大きな性能向上は見られない。
TS-CANモデルの深度が5層程度が最適である。