Core Concepts
MatPlotAgentは、科学データ可視化のための効率的なモデルに依存しないフレームワークであり、LLMの能力を向上させることができます。
Abstract
科学データ可視化の重要性とMatPlotAgentの導入について述べられている。
MatPlotAgentは、クエリ理解、コード生成、ビジュアルフィードバックメカニズムから構成されており、人間の専門家のプロットプロセスを模倣している。
MatPlotBenchという高品質なベンチマークが紹介されており、GPT-4Vを使用した自動評価手法が提案されている。
実験結果では、MatPlotAgentが様々なLLMのパフォーマンスを向上させることが示されている。
ビジュアルフィードバックメカニズムの影響に関する定量的および定性的分析も行われている。
Stats
MatPlotBenchは100件のテストケースから成り立ち、GPT-4Vを使用した自動評価手法が紹介された。
GPT-4は直接デコード時に48.86点を獲得し、MatPlotAgent適用時に61.16点まで向上した。