ALIGNBOTは、ユーザーのリマインダーを効果的に取り入れることで、家庭用ロボットのカスタマイズされたタスク計画を最適化するための革新的なフレームワークです。家庭環境では、ユーザーのリマインダーの量、多様性、マルチモーダルな性質が限られているため、これらとタスク計画を整合させることが大きな課題となっています。
ALIGNBOTでは、fine-tuned LLaVA-7Bモデルがアダプターとして機能し、GPT-4oにユーザーのリマインダーを内部化した構造化された指示形式のキューを提供します。これにより、GPT-4oはユーザーの個人的な好み、修正ガイダンス、状況に応じたサポートなどの多様なリマインダーを理解し、カスタマイズされたタスク計画を生成することができます。さらに、ALIGNBOTは、過去の成功事例から関連するものを動的に検索し、GPT-4oのプロンプトに組み込むことで、タスク計画の精度を向上させています。
ALIGNBOTの有効性を検証するため、実際の家庭環境を模した実験環境を構築し、1,500件以上のマルチモーダルデータセットを用いて評価を行いました。その結果、ALIGNBOTは既存のLLMおよびVLMベースのプランナーを大幅に上回る86.8%の成功率を達成し、ユーザーのリマインダーを解釈し整合させる能力の高さを示しました。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Zhaxizhuoma,... klo arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.11905.pdfSyvällisempiä Kysymyksiä