ジェネラティブAIを活用して、子供向けの没入型マルチモーダルストーリーを生成するシステムを開発する。
サーバレスプラットフォームを活用したモジュラーSDNアーキテクチャにより、エネルギー効率的で柔軟なネットワークサービスの提供が可能になる。
動画の連続フレームにある冗長性を活用し、最も重要な視覚トークンを保持しながら、総トークン数を大幅に削減することで、マルチモーダルLLMの実用的な導入を可能にする。
逆コンパイラの文脈感度を大幅に縮小することで、スケーラビリティ、完全性、精度を大幅に向上させることができる。
大規模言語モデルの推論では、トランスフォーマーモデルの構造と複数GPUのテンソル並列化戦略により、計算と通信が順次実行されるため、通信フェーズ中にコンピューティングリソースが大幅に活用されていない。この非効率性を緩和するために、通信プロセス全体を通じてコンピューティング能力を最適化する様々な手法が開発されてきた。本論文では、シーケンスレベルでの計算通信重複を実現する新しい戦略を提案し、30b/70bモデルを使った実験評価で大幅な効率改善を実現した。
本論文では、能動的推論エージェントのための反応型環境の概念を提案し、その具体的な実装であるRxEnvironments.jlパッケージを紹介する。反応型環境は、エージェントと環境の柔軟な相互作用を可能にし、複雑な多エージェント環境のモデル化を容易にする。
MLIR コンパイラの自動コード最適化を可能にする強化学習環境を提案し、その有効性を実証する。
大規模言語モデル (LLM) のシステムプロンプトを難読化することで、知的財産を保護しつつ、システム自体の機能を維持する。
求人検索サービスにおいて、真のマッチラベルと予測スコアを適切に組み合わせることで、より正確なマッチング予測と効果的な相互推薦を実現できる。
プロセスモデルから元のプロセス実行の洞察を引き出すことができる。