Core Concepts
指数平滑化(ETS)をMLPに直接組み込むことで、単純な構造ながらも効果的なシーケンスモデルを実現する。
Abstract
本論文では、指数平滑化(ETS)をMLPに直接組み込むことで、効果的なシーケンスモデルを提案している。
まず、ETSに学習可能な減衰係数αとβを導入し、複素数パラメータ化することで、ETSの表現力を高めている。次に、この拡張されたETSモジュールをMLPに組み込むことで、チャンネル情報のみを扱うMLPをシーケンス学習が可能なモデルに変換している。
提案手法は以下の特徴を持つ:
複雑な数学的導出を必要とせず、シンプルな構造を維持している
HiPPO初期化に依存せず、ランダム初期化でも良好な性能を発揮する
長距離依存性を持つベンチマークタスクでトランスフォーマーモデルを上回る性能を示す
自然言語理解タスクでもトランスフォーマーエンコーダと同等の性能を達成する
計算量とメモリ使用量の点でトランスフォーマーよりも効率的である
全体として、単純なETSをMLPに組み込むことで、効果的なシーケンスモデルを実現できることを示している。
Stats
長距離依存性を持つタスクでは、提案手法がトランスフォーマーモデルを約20ポイント上回る性能を示している。
自然言語理解タスクでも、トランスフォーマーエンコーダと同等の性能を達成している。