4.6 ベクトル計算機

4.6.1 ベクトル計算機のプログラム

ベクトル計算機NEC SX-Aurora TSUBASA[5](以下、SX)を用いた高速化について述べます。
SXは1台にベクトル長256のベクトル演算器を8コア持っています。
内側のループをコンパイラーの自動ベクトル化によってベクトル計算し、 外側のループをOpenMPによって並列計算します。
さらに複数のノードで計算するには領域分割を行いMPIを用いて並列計算します。
本プログラムは前節まででOpenMPとMPIによって並列化されていますので、 ベクトル計算機に対応することは比較的容易です。

4.6.2 ベクトル計算機の計算時間

表4-6-1に1〜2ノードの計算時間を示します。
表より2ノードでは1ノードの2倍近く速くなることがわかります。 また2ノードでは使用可能なメモリーが2倍になり、より大きな問題が計算できるようになります。

表4-6-1 SXの計算時間
(FUCUSスパコンVシステム、()内は1ノードとの速度比)
ノード数ベンチマーク300ベンチマーク400ベンチマーク500
115.7秒 (1.0)27.9秒 (1.0)48.9秒 (1.0)
29.0秒 (1.74)16.3秒 (1.71)27.6秒 (1.77)