マスクされた入力信号の表現を予測することで、入力信号をより効果的にモデル化できる自己教師あり学習手法を提案する。さらに、M2Dを拡張したM2D-Xにより、特定のアプリケーションに特化した表現学習を実現する。