이 논문은 동적 자원 관리(Dynamic Resource Management, DRM)의 설계 원칙을 제시한다. DRM은 작업 실행 중에 할당된 자원을 동적으로 변경할 수 있게 한다. 시스템 관점에서 DRM은 자원 할당과 작업 스케줄링에 새로운 수준의 유연성을 제공하여 시스템 효율성을 높일 수 있다. 사용자 관점에서는 요구사항에 맞는 자원을 요청할 수 있어 대기 시간이나 비용을 최적화할 수 있다.
그러나 DRM을 실제 시스템에 성공적으로 도입하는 것은 쉽지 않다. 애플리케이션, 프로그래밍 모델, 프로세스 관리자, 자원 관리 소프트웨어 등 HPC 소프트웨어 스택의 모든 계층에서 변경이 필요하고, 새로운 스케줄링 및 자원 최적화 기술과 정책을 수립하는 포괄적인 co-design 프로세스가 필요하기 때문이다.
이 논문에서는 DRM 문제를 동적 프로세스 관리(DPM)와 동적 자원 매핑/할당(DRA)으로 분해한다. DPM은 관리해야 할 프로세스(또는 프로세스 변경)를 결정하고, DRA는 프로세스를 실행할 자원을 식별한다. 이 두 계층 간의 인터페이스를 표준화하는 것이 중요하며, 이를 위해 유연성과 상호운용성을 고려한 설계가 필요하다.
이 논문에서는 DRM을 위한 6가지 설계 원칙을 제시하고, MPI와 PMIx 인터페이스에 이를 적용하는 방법을 보여준다. 또한 이러한 설계 원칙을 기반으로 한 프로토타입 구현 경험과 향후 연구 방향을 논의한다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Dominik Hube... lúc arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17107.pdfYêu cầu sâu hơn