Core Concepts
外部プログラムとしてのツールの統一定義を提供し、LMのタスク解決プロセスを支援する方法を明らかにする。
Abstract
この論文では、言語モデル(LM)がテキスト生成タスクで強力であることが述べられています。しかし、複雑なスキルを必要とするタスクに苦労し、トレーニングデータに含まれていない情報へのアクセスが必要な他のタスクを解決することができません。ツールは、LMを拡張し、新しい能力を与えるために使用されます。さまざまなシナリオでどのようにツールが役立つか、またどのように効率的なツール作成方法や使用方法があるかが詳細に説明されています。
目次:
導入:LMおよびツールの基本概念(§1)
ツール利用パラダイム:基本的なツール利用手法(§3)
プログラムコンテキストでのツール:ドメイン固有および汎用問題向け(§5.2)
ベンチマーク評価:既存データセットおよびAPIを活用した評価(§6)
ロジック形式生成:DSLやQDMRグラマー等(§5.2.1)
一般目的コード生成:PythonやJava等PLs(§5.2.2)
テスト時対推論時コスト:学習時間と推論時間コスト比較(§8)
結論:LMおよびプログラム言語を話すLM間での違い
Stats
LMsは数値計算に苦労していることが示唆されています。
多くの作業はAPIや外部プログラムを使用して知識にアクセスします。
Quotes
"Tools have substantially enhanced their performance for tasks that require complex skills."
"Inspired by the tools used by humans, some works introduce application-specific software as tools."