核心概念
本論文は、オープンソースの大規模言語モデルを用いて複雑な長期ロボット課題計画を解決するための新しい手法「MLDT」を提案する。MLDTは、目標レベル、タスクレベル、アクションレベルの3つの階層に課題を分解することで、オープンソースの大規模言語モデルの限られた推論能力に対応する。また、目標指向のコーパス生成手法とインストラクション微調整を組み合わせることで、言語モデルの課題計画能力を向上させる。
摘要
本論文は、オープンソースの大規模言語モデルを用いて複雑な長期ロボット課題計画を解決するための新しい手法「MLDT」を提案している。
まず、MLDTは課題を目標レベル、タスクレベル、アクションレベルの3つの階層に分解する。これにより、オープンソースの大規模言語モデルの限られた推論能力に対応することができる。
次に、目標指向のコーパス生成手法とインストラクション微調整を組み合わせることで、言語モデルの課題計画能力を向上させている。具体的には、ChatGPTを用いて目標に応じたコーパスを生成し、それを使ってインストラクション微調整を行う。
さらに、既存のデータセットでは複雑さが不足しているため、より難易度の高い「LongTasks」データセットを新たに構築している。
実験の結果、MLDTは既存手法と比べて大幅な性能向上を示し、特に複雑な長期課題において優れた成果を上げている。また、閉鎖的な大規模言語モデルにも適用可能であることが確認された。
以上より、MLDTは、オープンソースの大規模言語モデルを用いて複雑な長期ロボット課題計画を解決する上で有効な手法であることが示された。
統計資料
複雑な長期課題では、平均目標数が9.74個、平均最小アクションステップ数が77.01ステップ、平均オブジェクト数が15.79個、平均オブジェクト種類数が8.50種類と、従来のデータセットと比べて大幅に高い
一方、従来のデータセットでは、平均目標数が3.40~3.99個、平均最小アクションステップ数が26.27~27.02ステップ、平均オブジェクト数が4.97~5.32個、平均オブジェクト種類数が3.40~3.57種類と、相対的に低い
引述
"本論文は、オープンソースの大規模言語モデルを用いて複雑な長期ロボット課題計画を解決するための新しい手法「MLDT」を提案している。"
"MLDTは、目標レベル、タスクレベル、アクションレベルの3つの階層に課題を分解することで、オープンソースの大規模言語モデルの限られた推論能力に対応する。"
"目標指向のコーパス生成手法とインストラクション微調整を組み合わせることで、言語モデルの課題計画能力を向上させている。"