GPGPU計算 (HPC・倍精度浮動小数点)向け構成事例
GPGPU(CUDA)を使った数値計算では、使用する浮動小数点演算の精度によって適切なGPUが異なります。GeForceシリーズのGPUは比較的安価で単精度浮動小数点(FP32)の性能が高いものの、倍精度浮動小数点(FP64)の演算性能はFP32の演算性能と比べて非常に低いです。一方でTeslaシリーズや一部のQuadro, TITANモデルではFP32の演算性能だけでなくFP64の演算性能も高いのが特徴です。
Deep Learningのトレーニングにおける計算では一般的に単精度浮動小数点演算が使用され、その他に半精度浮動小数点と単精度浮動小数点と混在させた混合精度や整数なども使用されます。また、画像処理や信号処理の用途などでも単精度浮動小数点で十分なことが多く、こういった分野ではGeForceシリーズなどが用いられます。
一方、流体計算や構造計算、電磁波解析をはじめとした様々な分野の数値シミュレーションにおいては、単精度浮動小数点では精度が不足する計算が多々あります。そのようなシミュレーションにおいては、すべて倍精度浮動小数点を使用した計算あるいは倍精度浮動小数点と単精度浮動小数点を両方しようした混合精度での計算が必要になります。このような分野においてGPUの高い性能を活用するためにはNVIDIA V100S、A100などの倍精度浮動小数点演算性能が高いGPUを利用する必要があります。
GPGPU計算において必要なCPUの性能に関してはアプリケーションによってさまざまです。GPU上での計算中にCPU側でも並行してマルチコア計算を行う場合や、複数のGPUでの計算結果を元にCPUで計算を行って次のGPU計算の入力データにする場合はCPU性能も必要です。一方、CPUでの計算時間がGPUでの計算時間と比べて非常に短ければそれほどCPU性能は必要ないことになります。
構成事例
1. 倍精度浮動小数点演算を使用する自作コードのGPGPU計算


お問い合わせ内容
デスクサイドマシンで、倍精度浮動小数点演算を使用するGPGPU計算機。
ご提案構成
ご予算からTITAN Vを搭載する構成としました。将来的な拡張性も考慮し、3台のGPUをネイティブにPCI-E Gen3 X16動作させることができるEPYC CPUとしています。
主な仕様
- CPU: 1x EPYC 7262 3.2GHz 8コア
- メモリ: 64GB DDR4-3200 8-channel
- ビデオ: Onboard VGA
- GPGPU: NVIDIA TITAN V 12GB(モニタ出力兼用も可能)
- ミドルタワーケース
ご予算額や設置環境によってはNVIDIA V100S 32GBを搭載した構成にすることができます。NVIDIA V100Sの場合も最大4枚搭載可能で、騒音対策がされたサーバ室ではなく研究室などに設置することもできます。
関連モデル
・GPU-EPYC1W-V100S :
本ページのハードウェア構成は納品当時の構成のため、最新のパーツではないことがあります。また同分野のアプリケーションであっても実際の性能は計算モデル、アルゴリズム、コンパイラ、ソルバーやライブラリ、ソースコードなどに依存するため、必ずしも最適な構成ではない場合があります。