Belangrijkste concepten
대규모 클라우드 시스템에서 발생하는 인시던트들 간의 관계를 정확하게 파악하여 신속한 해결과 운영 효율성 향상
Statistieken
대규모 클라우드 시스템에서 한 시간의 서비스 중단으로 인한 비용은 약 1억 달러에 달함
본 연구에서 고려한 5개 워크로드에는 총 610개의 서비스가 포함되며, 이들 간의 의존성 그래프에는 5,500개 이상의 엣지가 존재함
Citaten
"대규모 클라우드 운영자(Google, Microsoft, Amazon 등)는 수만 개의 서비스를 운영하며, 이들 간 복잡한 아키텍처와 의존성으로 인해 인시던트가 불가피하게 발생한다."
"이러한 연쇄 효과로 인해 단시간 내 다수의 경고가 다른 서비스에서 보고되는 '경고 폭풍'이 발생하며, 이는 도메인 전문성과 서비스 간 의존성 지식 없이는 해결하기 어려운 문제이다."