低消費電力デバイスでのジェスチャー認識技術の革新的方法論を紹介し、個々に設計されたハードウェアの一般化を促進する。
LLMにおけるプライバシー、倫理、法的課題への対処を目指す、機械アンラーニングの重要性。
スキャンパスを特徴ベクトルに変換するためのトレーニング可能な特徴抽出モジュールを提案し、深層ニューラルネットワークと共同で訓練可能であることを示す。
MLLMのバイアスを軽減し、視覚情報への基盤を向上させるためにBootstrapped Preference Optimization(BPO)が効果的である。
テキストからビデオ生成を向上させるために、ノイズとテキストプロンプトの2つの重要な入力を改善するPOSが提案されました。
レストランでのテーブルサービスを自動化するためのモデル比較と高速ドメイン適応に焦点を当てる。
動的なオーディオビジュアルシナリオでの質問に対する正確な回答を提供するために、CATはマルチモーダル大規模言語モデルを強化します。
多言語の毒性緩和に関する包括的な研究を通じて、文化的に敏感な言語技術への移行を促す。
現代の生成AIパラダイムにおける未解決の主要な課題を特定し、将来の研究を導くための優先事項を提案する。