本研究では、Householder重み付けと絶対値活性化関数を組み合わせた新しいニューラルレイヤー構造「Householder絶対値ニューラルレイヤー(Han-layer)」を提案した。
Han-layerの特徴は以下の通り:
実験の結果、Han-layerを使ったニューラルネットワーク(HanNet)は、既存の軽量モデルでも大幅にパラメータ数を削減しつつ、性能を維持または向上させることができることが示された。特に、チェッカーボードデータセットなどの構造化データに対して、HanNetは従来のMLPを大きく上回る一般化性能を発揮した。
また、HanNetはMNISTデータセットでの堅牢性も示し、同等の清浄精度でFCNetよりも高い攻撃耐性を持つことが確認された。さらに、画像分類タスクでもMLP-Mixerモデルにおいて、Han-layerの導入によって性能向上が確認された。
以上より、Han-layerは軽量モデルの構築や勾配安定性の確保に有効な手法であり、幅広いタスクで活用できる可能性が示された。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies