4.6 各手法の比較

以上で述べた各手法の計算時間をまとめたものを表4-6-1に示します。
No.2-3からマルチスレッド/マルチプロセスにより約1.7倍速くなることがわかります。 ただし、CPUにXeonを用いるとさらに速くなります。
一方No.4-5からGPUを用いるCUDAはさらに大幅に速くなります。 GPUはプログラミングの作業量は増えますが高速化には一番効果があります。 ただし、GPUはメモリー容量がCPUに比べて一般に小さく、大規模問題に適用できないという限界があります。

表4-6-1 各手法の計算時間 (Windows、ベンチマークNo.2)
No.ハードウェア高速化手法計算時間速度比出所
1CPU高速化なし 233.5秒 1.0 表4-2-1
2CPUOpenMP 4スレッド 134.6秒 1.73 表4-2-1
3CPUMPI 4プロセス 134.4秒 1.74 表4-3-1
4GPUCUDA 1GPU 10.8秒 21.6 表4-4-1
5GPUCUDA+MPI 2GPU 6.9秒 33.8 表4-5-1
参考CPU(Xeon)MPI 40プロセス17.1秒13.7 表4-3-3
CPU : Intel Core i7-4770K 定格
GPU : NVIDIA GeForce GTX1070, 8GB GDDR5
CPU(Xeon) : Intel Xeon D-1541 (Linux)