MuZeroは、長期的な予測においてダイナミクスネットワークの精度が低下する場合でも、プランニング中にエラーを修正することで効果的に動作します。
深層学習モデルは、ノイズの多いラベルで事前学習すると、単純な特徴に頼るのではなく、より複雑で多様な特徴セットを学習できるようになる。
本稿では、低品質の静的データセットを用いたオフライン強化学習において、より効果的なポリシー学習を実現するハイパーキューブポリシー正規化フレームワークを提案する。
拡散モデルは時系列予測において優れた能力を発揮するが、決定論的な予測においては、その確率的性質による不安定さが課題となる。本稿では、既存の拡散ベースの手法を包含する包括的なフレームワークを提示し、その上で、ブラウンブリッジ過程を活用して逆推定におけるランダム性を低減し、過去の時系列データから得られる事前情報と条件を取り入れることで精度を向上させた、新しい拡散ベースの時系列予測モデル「Series-to-Series Diffusion Bridge Model (S2DBM)」を提案する。
本稿では、修正された人間原理を用いることで、因果決定理論 (CDT) が、ニューカム問題のような予測と因果関係が複雑に絡み合った状況においても、事前最適政策を推奨できるかどうかを考察しています。
ACCIOは、元のテーブルとそのピボットテーブルを対照学習で比較することで、テーブル理解を向上させる新しい手法である。
事前トレーニングされたエージェントとワールドモデルのパフォーマンスは、モデルのパラメータ数、データセットサイズ、計算量の増加によって向上しますが、その関係は単純な「大きいほど良い」という直観を超えて、言語モデルと同様にべき乗則に従うことが明らかになりました。
本稿では、従来の時間点過程混合モデルにおける過剰適合とクラスタ多様性不足の問題に対処するため、決定点過程事前分布を用いた新しいベイズ混合モデル(TP2DP2)を提案する。
ニューラルネットワークと記号論理処理を組み合わせたニューロシンボリックAIは、AIモデルの全体的なパフォーマンスを向上させる効果的な手法であるが、そのデータ処理方法の違い、特にデータ表現方法の違いが、両者の連携を阻害する要因となっている。
表形式データのFew-Shot学習において、従来手法よりも大幅に性能が向上したとされる大規模言語モデル(LLM)ベースの手法は、比較対象としたベースライン手法の性能が不十分であった可能性があり、実際には勾配ブースティング決定木(GBDT)も適切なパラメータ設定を行うことでFew-Shot学習において競争力のある性能を発揮する。