本文提出了一種名為 EinDecomp 的自動分解方法,利用擴展的愛因斯坦求和表示法 (EinSum) 將張量計算表示為張量關係代數 (TRA) 運算,並通過優化 TRA 計算中的分區向量,最小化平行執行時的通信成本,從而實現高效的平行計算。
EinSum이라는 확장된 아인슈타인 합 표기법을 사용하여 텐서 연산을 선언적으로 지정하고, 이를 텐서 관계형 연산으로 변환하여 자동으로 병렬화하는 EinDecomp 알고리즘을 제안합니다.
EinSumと呼ばれる拡張されたアインシュタイン縮約記法に基づくプログラミング抽象化を用いることで、テンソルベースの計算の自動分解と並列実行が可能になる。
EinDecomp is a novel system that leverages an extended Einstein summation notation (EinSum) and a tensor-relational algebra (TRA) to automatically decompose and parallelize complex tensor computations for efficient execution on multi-device systems.
透過將記憶體管理任務卸載到智慧網卡,SODA 能夠有效利用網路附加記憶體,提升記憶體密集型應用程式的效能。
스마트NIC 오프로딩을 통해 네트워크 연결 메모리 관리 작업을 효율적으로 처리하여 그래프 처리 애플리케이션의 성능을 향상시킬 수 있다.
メモリ負荷の高いグラフ処理アプリケーションにおいて、SmartNICオフロードを用いたメモリ分離は、従来のノードローカルストレージと比較して最大7.9倍の高速化を実現し、ネットワークトラフィックを大幅に削減できる。
Offloading disaggregated memory management tasks to SmartNICs, as exemplified by the SODA runtime library, significantly accelerates graph processing applications by enabling efficient utilization of network-attached memory.
LFRic 기상 및 기후 모델의 동적 코어 GungHo가 다양한 슈퍼컴퓨터 시스템에서 우수한 확장성을 보이며, I/O 성능 또한 구성 변경을 통해 크게 향상될 수 있음을 보여줌.
The LFRic weather and climate model, written in a domain-specific language and using a domain-specific compiler, demonstrates good scaling behavior up to large node counts on different generations of HPE Cray EX supercomputers. The performance analysis reveals the impact of algorithm choices, such as redundant computation, and the scaling behavior with OpenMP threads. The I/O performance of the XIOS server is also analyzed and optimized.