本稿では、情報ボトルネックを用いて、転送エントロピーを発生源となる過去のプロセスと、受信側となる未来のプロセスに分解する方法を提案する。
本論文では、大規模言語モデルの報酬モデリングにおけるブラッドリー・テリー(BT)モデルの理論的基礎と限界を分析し、順序の一貫性に基づくより柔軟で効果的な代替手段を提案しています。
事前学習済み可逆生成モデルを用いることで、新たなタスク概念を少数事例から効率的に学習できる。
大規模言語モデル(LLM)は医療診断支援に有望視されているものの、事前確率推定の信頼性には限界があり、臨床現場での活用には更なる改善が必要である。
本稿では、表形式データの欠損データ補完において、特徴量間の相互依存関係を捉え活用することで、その精度を向上させることができるという新しいフレームワークを提案する。
大規模ビジョン言語モデル(VLM)におけるプロンプト学習は、ドメインのシフトや新たなクラスの発見といった課題に対し、従来の手法を超える適応性と汎用性を実現する。
本稿では、従来の回帰モデルよりも優れた精度で高エントロピー合金(HEA)の機械的特性を予測できる、Transformerベースの新しい言語モデルアプローチを紹介する。
時間的間隔を考慮した報酬モデルを持つ予算制オークションにおいて、時間経過とともに最適な入札戦略を学習する効率的なオンラインアルゴリズムを提案する。
深層強化学習における可塑性喪失は、エージェントの学習能力の低下を招く深刻な問題であり、その原因と対策、そして将来展望について包括的に議論する必要がある。
本稿では、データストリーム上で動作する新しい決定木アルゴリズムであるソフトヘフディングツリー(SoHoT)を提案する。これは、既存のヘフディングツリーの利点である透明性と拡張性を維持しながら、ソフトツリーのように微分可能なため、ニューラルネットワークなどの深層学習システムに統合できる。