核心概念
MESS+は、大規模言語モデル群の中から、サービスレベル契約(SLA)で定められた精度要件を満たしつつ、エネルギー消費量を最小限に抑える最適なモデルを選択するオンライン確率的最適化アルゴリズムである。
要約
MESS+:サービスレベル保証を満たす大規模言語モデル群におけるエネルギー最適化推論
本稿は、大規模言語モデル(LLM)群の中から、サービスレベル契約(SLA)で定められた精度要件を満たしつつ、エネルギー消費量を最小限に抑える最適なモデルを選択するオンライン確率的最適化アルゴリズム、MESS+を提案する。
近年、Llama、Mistral/Mixtral、Graniteなど、オープンソースの大規模言語モデル(LLM)が急増しており、開発者や企業は、自然言語処理タスクに最適なモデルを選択することが課題となっている。従来のモデル選択は、公開されているベンチマーク結果や経験に基づく推測に頼ることが多く、非効率で、必ずしも最適な結果が得られるとは限らない。