Core Concepts
애플 통합 메모리 GPU에서 CPU 정렬이 GPU 정렬보다 ExaSMR 전체 노심 및 HTR-10 연료 펠릿 벤치마크 문제에 대해 더 높은 전력 효율을 달성한다.
Abstract
이 연구는 애플 통합 메모리 컴퓨팅 장치를 사용하여 몬테카를로 중성자 수송 방법에서 CPU와 GPU의 협업을 연구한다. 이전에는 CPU와 GPU가 분리된 장치에서 낮은 데이터 전송률과 높은 데이터 전송 지연 때문에 이러한 협업이 경제적이지 않았다.
주요 내용은 다음과 같다:
애플 M2 Max 칩 프로그래밍에 대한 논의
부분적으로 정렬된 데이터에 대한 CPU-GPU 정렬 성능 연구
VERA 핀셀 및 어셈블리 벤치마크 문제에 대한 내부 통합 CPU-GPU 코드 검증
ExaSMR 전체 노심 및 HTR-10 연료 펠릿 벤치마크 문제에 대한 CPU 및 GPU 정렬 전략의 시뮬레이션 전력 효율 비교
Stats
내부 코드 CPU 정렬은 ExaSMR 전체 노심 벤치마크 문제에서 신선 연료의 경우 OpenMC CPU 대비 3.0배, 소모 연료의 경우 7.5배 전력 효율이 높다.
내부 코드 CPU 정렬은 HTR-10 연료 펠릿 벤치마크 문제에서 신선 연료의 경우 OpenMC CPU 대비 270배, 소모 연료의 경우 150배 전력 효율이 높다.
Quotes
"CPU 정렬 알고리즘이 GPU 정렬보다 ExaSMR 전체 노심 벤치마크 문제와 HTR-10 고온 가스 원자로 연료 펠릿 문제에 대해 더 나은 전력 효율을 달성한다."
"부분적으로 정렬된 입자 순서가 CPU 정렬이 GPU 정렬보다 더 높은 성능을 기여한다고 확인되었다."