核心概念
大規模言語モデル(LLM)のワークフローオーケストレーション機能を向上させるには、現実世界のワークフローデータセットを用いたファインチューニングが有効である。
要約
WorkflowLLM:大規模言語モデルを用いたワークフローオーケストレーションの高度化
本稿では、大規模言語モデル(LLM)を用いて複雑なワークフローのオーケストレーション能力を向上させることを目的とした、データ中心型フレームワーク「WorkflowLLM」が提案されています。
従来の業務自動化(RPA)は、人間の手作業によるワークフロー構築に依存しており、柔軟性や適応性に限界がありました。近年、LLMの登場により、人間からの指示に基づいてワークフローを自動構築する、エージェントプロセスオートメーション(APA)へのパラダイムシフトが期待されています。しかし、既存のLLMは複雑なワークフローのオーケストレーション能力が限られており、APAの実用化には課題が残されています。
WorkflowLLMは、LLMのワークフローオーケストレーション能力を向上させるために、高品質な教師ありファインチューニングデータセット「WorkflowBench」を構築します。WorkflowBenchは、データ収集、クエリ拡張、ワークフロー生成の3段階を経て構築されます。
データ収集
Apple ShortcutsとRoutineHubから、人間が作成した高品質なショートカットを収集し、Python風のコードに変換します。さらに、ChatGPTを用いて、各ショートカットに対してコメント、タスクプラン、タスククエリなどの階層的な思考を生成し、データに詳細な思考プロセスを追加します。
クエリ拡張
ChatGPTを用いて、多様なAPIやワークフローカテゴリを網羅したタスククエリを生成し、データの多様性と複雑さを向上させます。
ワークフロー生成
収集したショートカットデータに基づいてワークフローアノテータモデルを学習し、生成されたタスククエリに対応するワークフローを生成します。品質確認を行い、論理エラーを含むワークフローを削除することで、データセットの品質を確保します。