本研究では、Expert Routerと呼ばれる新しいシステムを提案している。Expert Routerは、大規模言語モデル(LLM)の推論処理を効率的に管理・調整するためのシステムである。
具体的には以下の特徴を持つ:
実験の結果、Expert Routerは単一の大規模LLMモデルと比べて、ユーザ視点での応答時間や全体的なスループットが向上することが示された。特に、並行ユーザ数が増加する状況下で、その効果が顕著に現れた。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Josef Pichlm... lúc arxiv.org 04-24-2024
https://arxiv.org/pdf/2404.15153.pdfYêu cầu sâu hơn