提案手法では、各階層的な残差ステージを2つのサブパスに分割し、1つ目のサブパスは必須の階層的特徴学習に、2つ目のサブパスは特徴を最小限に変更しつつ精緻化するように最適化する。これにより、単一のネットワークから様々な精度-効率のトレードオフを持つサブネットワークを組み合わせて選択できる。
脳型中間表現(NIR)は、デジタル脳型システムのための共通の参照フレームを定義し、ハードウェアとソフトウェアの開発を切り離すことで、相互運用性を向上させ、アクセシビリティを高めます。
ニューラルオーディオコーデックを使用して連続オーディオ信号を離散トークンに量子化すると、同一のオーディオ信号が異なる離散トークン系列にエンコーディングされる問題が発生する。これは離散表現の不整合(Discrete Representation Inconsistency: DRI)と呼ばれ、ニューラルコーデック言語モデルの予測精度を低下させる。
Maia-2は、チェスにおける人間の行動をスキルレベル全体にわたって一貫して捉えることができる統一モデルである。スキルレベルに応じて動的に特徴を統合することで、人間のチェス行動をより正確に予測できる。
CGPOは、報酬モデルの限界を補完する複数の制約を導入し、各タスクに最適化された報酬モデル、MoJ、最適化手法を組み合わせることで、LLMの多目的・多制約アラインメントを効果的に実現する。
言語モデルの能力が向上するにつれ、ユーザーの微妙で個性的な嗜好に合わせてやり取りをカスタマイズする可能性が高まっている。PersonalLLMは、特定のユーザーに最大の利益をもたらすようにLLMを適応させることに焦点を当てた新しいベンチマークである。
MemSimは、LLMベースの個人アシスタントの記憶能力を客観的かつ自動的に評価するためのシミュレータである。ユーザメッセージから信頼性の高い質問と答えを自動的に生成し、記憶メカニズムの評価を可能にする。
ニューラルオーディオウォーターマーキングの堅牢性と可逆性を向上させるため、ウォーターマークメッセージとロケーションコードを別々にエンベディングする手法を提案する。また、攻撃層の影響を緩和するためのバランスブロックを導入し、ウォーターマーキングの安定性を高める。
局所的および大域的特徴を学習する新しいINR アーキテクチャを提案し、信号の部分的な削除や拡張を容易に行えるようにする。
NeRV-Encは従来のグラジエントベースの最適化手法に比べて104倍高速にビデオエンコーディングを行うことができ、NeRV-Decは従来のビデオコーデックよりも11倍高速にビデオデコーディングを行うことができる。