機械学習におけるスパリアス性は、非因果関係という統計的な定義を超えて、関連性、汎化性、人間らしさ、有害性という複数の次元で解釈され、研究の進展に影響を与える可能性がある。
異なる生理学的信号セットを用いてトレーニング可能な単一の統合深層学習モデルは、睡眠段階分類において、従来の単一モダリティまたは転移学習ベースのアプローチよりも優れたパフォーマンスを発揮する。
MuZeroは、長期的な予測においてダイナミクスネットワークの精度が低下する場合でも、プランニング中にエラーを修正することで効果的に動作します。
深層学習モデルは、ノイズの多いラベルで事前学習すると、単純な特徴に頼るのではなく、より複雑で多様な特徴セットを学習できるようになる。
本稿では、低品質の静的データセットを用いたオフライン強化学習において、より効果的なポリシー学習を実現するハイパーキューブポリシー正規化フレームワークを提案する。
拡散モデルは時系列予測において優れた能力を発揮するが、決定論的な予測においては、その確率的性質による不安定さが課題となる。本稿では、既存の拡散ベースの手法を包含する包括的なフレームワークを提示し、その上で、ブラウンブリッジ過程を活用して逆推定におけるランダム性を低減し、過去の時系列データから得られる事前情報と条件を取り入れることで精度を向上させた、新しい拡散ベースの時系列予測モデル「Series-to-Series Diffusion Bridge Model (S2DBM)」を提案する。
本稿では、修正された人間原理を用いることで、因果決定理論 (CDT) が、ニューカム問題のような予測と因果関係が複雑に絡み合った状況においても、事前最適政策を推奨できるかどうかを考察しています。
ACCIOは、元のテーブルとそのピボットテーブルを対照学習で比較することで、テーブル理解を向上させる新しい手法である。
事前トレーニングされたエージェントとワールドモデルのパフォーマンスは、モデルのパラメータ数、データセットサイズ、計算量の増加によって向上しますが、その関係は単純な「大きいほど良い」という直観を超えて、言語モデルと同様にべき乗則に従うことが明らかになりました。
本稿では、従来の時間点過程混合モデルにおける過剰適合とクラスタ多様性不足の問題に対処するため、決定点過程事前分布を用いた新しいベイズ混合モデル(TP2DP2)を提案する。