VALは、大規模言語モデルを特定の下位タスクに限定的に活用することで、自然言語対話を通じて階層的なタスク知識を獲得する。
まず、ユーザーからの命令を自然言語で受け取り、それを個別のステップに分割する。次に、既知のアクションにマッピングを試み、マッピングできない場合は新しいアクションを定義するよう、ユーザーに確認を求める。この確認と定義のプロセスを再帰的に行うことで、階層的なタスク知識を構築していく。
大規模言語モデルは、アクションの抽出や引数の選択など、特定の自然言語処理タスクに限定的に活用される。一方で、タスク知識の獲得アルゴリズム自体は、クラシカルな手法に基づいている。これにより、大規模言語モデルの柔軟性を活かしつつ、解釈可能で一貫性のある知識表現を実現している。
ユーザー評価実験の結果、多くのユーザーがVALを使ってタスクを教えられることが示された。一方で、大規模言語モデルの出力に対する確認ダイアログの頻度が高く、ユーザー体験を損なう可能性が指摘された。今後の課題として、確認ダイアログの削減や、より自然な対話インタフェースの実現が挙げられる。
翻譯成其他語言
從原文內容
arxiv.org
深入探究