4.8 各手法の比較

以上で述べた各手法の計算時間をまとめたものを表4-8-1に示します。
ハードウェアの詳細は4.1の通りです。
CPUで計算するときはOpenMPよりMPIの方が速く、 GPU/SX/FXはそれより大幅に速くなります。
GPU/SX/FXはメモリー容量が十分に大きくないために大規模問題に適用できないという限界がありますが、 複数ノードで計算すると計算時間が短縮されると同時に使用できるメモリーも増えます。

表4-8-1 各手法の計算時間 (FOCUSスパコン、ベンチマーク400共通)
No.システムハードウェアノード数高速化手法 計算時間出所
0FCPU 1(参考) 並列化なし 2327.8秒表4-2-1
1FCPU 1OpenMP 40スレッド 288.6秒表4-2-1
2FCPU 1MPI 40プロセス 179.4秒表4-3-1
3FGPU 1CUDA 39.9秒表4-5-1
4FGPU 2CUDA+MPI 2プロセス 21.5秒表4-5-1
5VSX A1001ベクトル化+OpenMP 8スレッド 28.9秒表4-6-1
6VSX A1002ベクトル化+OpenMP 8スレッド+MPI 2プロセス 15.6秒表4-6-1
7WSX A3001ベクトル化+OpenMP 8スレッド+MPI 8プロセス 5.5秒表4-6-2
8XFX700 1ベクトル化+OpenMP 12スレッド+MPI 4プロセス 36.8秒表4-7-1
CPU : Intel Xeon E5-2698v4 x2
GPU : NVIDIA Tesla P100
SX A100 : NEC SX-Aurora TSUBASA A100-1VE
SX A300 : NEC SX-Aurora TSUBASA A300-8VE
FX700 : Fujitsu Supercomputer PRIMEHPC FX700