核心概念
モバイルデバイスでのLLMの関数呼び出しを効率化するため、Alopexフレームワークは高品質なトレーニングデータ生成、効率的なデータフォーマット、破滅的忘却を軽減するデータ混合戦略を提供する。
要約
Alopex: LLMを用いたデバイス上での関数呼び出しを実現する計算フレームワーク
この研究論文は、モバイルデバイス上で大規模言語モデル (LLM) を使用して正確なドメイン固有の応答を生成するために、デバイス上の関数呼び出しを可能にする計算フレームワークであるAlopexを提案しています。
LLMはソフトウェアアプリケーションに広く統合されつつあり、研究者はモバイルデバイス向けのLLM搭載エージェントの開発に焦点を当てています。これらのエージェントは、外部API関数を呼び出すことでパフォーマンスを向上させることができます。しかし、データの不足、効果的な質問フォーマットの欠如、破滅的忘却などの課題が、関数呼び出し機能を備えたオンデバイスLLMエージェントの開発を妨げています。
Alopexは、Fox LLMを使用してオンデバイス関数呼び出しを可能にするように設計されたフレームワークです。このフレームワークは、以下の3つの主要なコンポーネントで構成されています。
1. ルールベースロジックを使用した関数呼び出しデモの生成
Alopexは、高品質なトレーニングデータを生成するために、ルールベースのロジックを使用します。このアプローチでは、各APIの関数記述に基づいて、一般的なユーザーの質問をリクエストとコマンドの2つのスタイルに分類します。リクエストは、質問部分、アクション部分、パラメータ部分に分けられます。コマンドには、アクション部分とパラメータ部分のみが含まれます。
2. LLMファインチューニングのための関数呼び出しデモのフォーマット
Alopexは、LLMファインチューニングのために、「説明-質問-出力」という新しいデータ形式を導入しています。この形式は、既存の形式よりも優れており、関数情報の漏洩のリスクを軽減します。
3. LLMファインチューニングにおける破滅的忘却の克服
Alopexは、関数呼び出しのためのLLMファインチューニングにおける破滅的忘却を克服するために、データ混合アプローチを導入しています。関数呼び出しデータセットと教科書データセットを組み合わせることで、ファインチューニングされたLLMが関数呼び出しと他のLLM評価ベンチマークの両方で優れたパフォーマンスを発揮することを示しています。