Core Concepts
クラウドソフトウェアシステムの複雑さが増す中、LLMベースのエージェントを使用して根本原因分析を探索する。
Abstract
クラウドベースのソフトウェアシステムの複雑さが増す中、インシデント管理はソフトウェア開発ライフサイクルの重要な部分となっています。根本原因分析(RCA)はインシデント管理プロセスの重要な部分であり、オンコールエンジニアにとっては要求されるタスクです。最近、研究者たちは大規模言語モデル(LLMs)を使用してRCAを実行し、有望な結果を示しています。しかし、これらのアプローチは追加診断情報を動的に収集することができず、その能力が制限されています。この研究では、この制限に対処するためにLLMベースのエージェントを使用したRCAの可能性を探求します。
Stats
研究者たちは102,000件のトレーニングセットから100件の評価セットと500件のテストセットをランダムサンプリングしました。
RB(k=10)はC-BLEUで最高性能を示しました。
CoTはS-BLEUおよびMETEORで低下しました。
ReAct BRはrougeLおよびMETEORで改善が見られました。
Quotes
"The growing complexity of cloud based software systems has resulted in incident management becoming an integral part of the software development lifecycle."
"Recently, researchers have utilized Large Language Models (LLMs) to perform RCA, and have demonstrated promising results."
"In this work, we explore the use of LLM based agents for RCA to address this limitation."