이 논문은 동적 자원 관리(Dynamic Resource Management, DRM)의 설계 원칙을 제시한다. DRM은 작업 실행 중에 할당된 자원을 동적으로 변경할 수 있게 한다. 시스템 관점에서 DRM은 자원 할당과 작업 스케줄링에 새로운 수준의 유연성을 제공하여 시스템 효율성을 높일 수 있다. 사용자 관점에서는 요구사항에 맞는 자원을 요청할 수 있어 대기 시간이나 비용을 최적화할 수 있다.
그러나 DRM을 실제 시스템에 성공적으로 도입하는 것은 쉽지 않다. 애플리케이션, 프로그래밍 모델, 프로세스 관리자, 자원 관리 소프트웨어 등 HPC 소프트웨어 스택의 모든 계층에서 변경이 필요하고, 새로운 스케줄링 및 자원 최적화 기술과 정책을 수립하는 포괄적인 co-design 프로세스가 필요하기 때문이다.
이 논문에서는 DRM 문제를 동적 프로세스 관리(DPM)와 동적 자원 매핑/할당(DRA)으로 분해한다. DPM은 관리해야 할 프로세스(또는 프로세스 변경)를 결정하고, DRA는 프로세스를 실행할 자원을 식별한다. 이 두 계층 간의 인터페이스를 표준화하는 것이 중요하며, 이를 위해 유연성과 상호운용성을 고려한 설계가 필요하다.
이 논문에서는 DRM을 위한 6가지 설계 원칙을 제시하고, MPI와 PMIx 인터페이스에 이를 적용하는 방법을 보여준다. 또한 이러한 설계 원칙을 기반으로 한 프로토타입 구현 경험과 향후 연구 방향을 논의한다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Dominik Hube... klokken arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17107.pdfDypere Spørsmål