المفاهيم الأساسية
大規模データベースと複雑な質問を含むテキストからSQLへの変換タスクにおいて、MAG-SQLは、ソフトスキーマリンキング、目標-条件分解、および反復的なサブSQL生成とリファインメントを通じて、従来のIn-Context Learningベースの手法よりも優れたパフォーマンスを実現します。
الملخص
MAG-SQL: テキストからSQLへの変換のためのマルチエージェント生成アプローチ
本稿では、複雑なデータベーススキーマと質問を含むデータセットにおいて、テキストからSQLへの変換タスクの精度を向上させることを目的とした、新しいマルチエージェント生成アプローチであるMAG-SQLを紹介します。
従来のIn-Context LearningベースのテキストからSQLへの変換手法は、BIRDのような複雑なデータベーススキーマと質問を含むデータセットにおいて、精度が低いという課題がありました。特に、質問分解を用いて段階的に問題を解決する際に中間ステップの監視が不足しており、スキーマリンキングも基本的な方法に留まっていました。
MAG-SQLは、ソフトスキーマリンキング、目標-条件分解、サブSQL生成、サブSQLリファインメントの4つのエージェントで構成されています。
ソフトスキーマリンキング
大規模なデータベーススキーマから関連するカラムを効率的に選択するために、ソフトスキーマリンキングを採用しています。このエージェントは、テーブルの要約と値検索によって強化された、エンティティベースのスキーマリンキング手法を用いて、関連するスキーマを抽出し、データベーススキーマプロンプトを構築します。
目標-条件分解
複雑な質問を段階的に解決可能なサブ質問に分解するために、目標-条件分解という新しい手法を提案します。この手法では、質問をクエリ対象とフィルタ条件に分解し、それらを段階的に組み合わせることで、サブクエリを生成します。
サブSQL生成とリファインメント
サブSQL生成エージェントは、前のサブ質問とサブSQLに基づいて、現在のサブ質問に対するサブSQLを生成します。生成された各サブSQLは、サブSQLリファインメントエージェントによってチェックおよび修正されます。このエージェントは、外部ツールを用いてサブSQLの実行可能性をテストし、エラー情報に基づいて誤ったSQLクエリを修正します。