GPGPU計算 (HPC・倍精度浮動小数点)向け構成事例

GPGPU(CUDA)を使った数値計算では、使用する浮動小数点演算の精度によって適切なGPUが異なります。GeForceシリーズのGPUは比較的安価で単精度浮動小数点(FP32)の性能が高いものの、倍精度浮動小数点(FP64)の演算性能はFP32の演算性能と比べて非常に低いです。一方でTeslaシリーズや一部のQuadro, TITANモデルではFP32の演算性能だけでなくFP64の演算性能も高いのが特徴です。

Deep Learningのトレーニングにおける計算では一般的に単精度浮動小数点演算が使用され、その他に半精度浮動小数点と単精度浮動小数点と混在させた混合精度や整数なども使用されます。また、画像処理や信号処理の用途などでも単精度浮動小数点で十分なことが多く、こういった分野ではGeForceシリーズなどが用いられます。

一方、流体計算や構造計算、電磁波解析をはじめとした様々な分野の数値シミュレーションにおいては、単精度浮動小数点では精度が不足する計算が多々あります。そのようなシミュレーションにおいては、すべて倍精度浮動小数点を使用した計算あるいは倍精度浮動小数点と単精度浮動小数点を両方しようした混合精度での計算が必要になります。このような分野においてGPUの高い性能を活用するためにはNVIDIA V100S、A100などの倍精度浮動小数点演算性能が高いGPUを利用する必要があります。

GPGPU計算において必要なCPUの性能に関してはアプリケーションによってさまざまです。GPU上での計算中にCPU側でも並行してマルチコア計算を行う場合や、複数のGPUでの計算結果を元にCPUで計算を行って次のGPU計算の入力データにする場合はCPU性能も必要です。一方、CPUでの計算時間がGPUでの計算時間と比べて非常に短ければそれほどCPU性能は必要ないことになります。

構成事例

1. 水冷NVIDIA V100S搭載デスクサイドGPUパソコン

お問い合わせ内容

デスクサイドマシンで、倍精度浮動小数点演算を使用できるGPGPU計算機。NVIDIA V100S以外のスペックは予算内の範囲で可能なもの。

ご提案構成

デスクサイドでの利用のため騒音の大きなサーバ向け筐体にすることはできないため、NVIDIA V100S 1枚を当社水冷方式で搭載しました。ご予算上限からCPUやメモリはそれほど性能の高いものを確保できないため、CPUはXeon Silver 1基、メモリは96GBとしました。

主な仕様

  • CPU: 1x Intel Xeon Silver
  • メモリ: 96GB DDR4-2400 6-channel
  • ビデオ: Onboard VGA
  • GPGPU: 当社水冷1x NVIDIA V100S 32GB
  • ATXミドルタワーケース

ベースモデル

GPU-Xeon1W-A100X2-LC (※現行モデル)

2. 水冷NVIDIA A100 PCIe 40GB搭載GPUワークステーション

お問い合わせ内容

NVIDIA A100 PCIeを1枚搭載した数値計算・ディープラーニング用GPUワークステーション。

ご提案構成

CPUは16コアのThreadripper PRO 3955WXを1基搭載、メモリを512GB (ECC Registered)、GPUを当社水冷仕様のNVIDIA A100 40GB PCIeを1枚搭載した構成としました。基本構成の制約から、ケースはフルタワー型となりました。

主な仕様

  • CPU: Threadripper PRO 3955WX 16コア
  • メモリ: 512GB DDR4-3200 8-channel (ECC Registered)
  • Video: NVIDIA GeForce GT1030
  • GPGPU: 当社水冷 1x NVIDIA A100 40GB PCIe
  • フルタワーケース

ベースモデル

GPU-TRPRO-A100-LC


本ページのハードウェア構成は納品当時の構成のため、最新のパーツではないことがあります。また同分野のアプリケーションであっても実際の性能は計算モデル、アルゴリズム、コンパイラ、ソルバーやライブラリ、ソースコードなどに依存するため、必ずしも最適な構成ではない場合があります。