Core Concepts
ガウシアン原子軌道を用いた3中心および4中心2粒子積分の効率的なGPU実装を提案した。マトリックス形式のMcMurchie-Davidson法を利用し、低角運動量から高角運動量の積分を高性能に評価できる。
Abstract
本研究では、ガウシアン原子軌道を用いた3中心および4中心2粒子積分の効率的なGPU実装を提案した。
まず、McMurchie-Davidson (MD)法の概要を説明した。MDスキームでは、ガウシアン原子軌道を展開するためにエルミート・ガウシアンを使用し、2粒子積分を1次元積分の組み合わせとして評価する。
次に、MDスキームの3つの変種を提案した。V0は低角運動量積分に最適化、V1は中角運動量積分に最適化、V2は高角運動量積分に最適化されている。これらの変種は、中間結果の配置や計算の融合を工夫することで、GPUのメモリ階層を最大限に活用し、高性能を実現している。
提案手法は、オープンソースのLibintXライブラリの一部として実装されている。性能評価の結果、提案手法は4中心積分で73倍、3中心積分で最大1700倍のCPU実装に対する高速化を達成した。さらに、交換演算子の初期実装も示し、20,000以上の原子軌道関数を持つ大規模系の計算が可能であることを示した。