3.7 計算時間のまとめ

表3-7-1に高速化技術ごとの計算時間を示します。
各ハードウェアで最も速くなる条件を選択しています。

表3-7-1 計算時間のまとめ(FOCUSスパコン, benchmark600共通)
No.システムハードウェア 計算時間モード 並列化手法 出所
1 F CPU 1ノード 77.0秒 novectorOpenMP 20スレッド 表3-2-1
2 F CPU 1ノード 73.1秒 novectorMPI 40プロセス 表3-3-1
3 F GPU 1ノード 36.7秒 novectorCUDA 表3-4-1
4 F GPU 2ノード 20.0秒 novectorCUDA×MPI 2プロセス 表3-4-1
5 W SX A300 1VE 62.5秒 vector OpenMP 8スレッド 表3-5-1
6 W SX A300 8VE 9.6秒 vector MPI 8プロセス×OpenMP 8スレッド 表3-5-1
7 X FX700 1ノード44.9秒 vector MPI 4プロセス×OpenMP 12スレッド表3-6-1
CPU : Intel Xeon E5-2698v4 x2
GPU : NVIDIA Tesla P100
SX A300 : NEC SX-Aurora TSUBASA A300-8VE
FX700 : Fujitsu Supercomputer PRIMEHPC FX700