機械学習・ディープラーニング向け構成事例
Deep Learningの学習用途で、同一マシンにGPUを複数枚搭載する構成の事例です。個々のGPUで独立して計算を実行する場合や、複数のGPUを使って並列に計算する場合があります。CPUとGPUの間のPCIe帯域幅の重要性は、同一マシンに搭載された複数GPUの使い方、計算させるモデルやネットワークの構成によります。PCIeでの転送時間がGPU上での計算よりも圧倒的に短い場合や、独立したモデルを各GPUに割り振って計算させる場合にはPCIeの帯域幅がそれほど重視されないこともあります。
Deep Learningの学習で要求されるGPUメモリ量は、計算させるモデルやネットワークの構成、入力データなどによって異なります。それほどGPUのメモリ量が必要でなければGeForceの費用対効果が高く、一方で物体検出など比較的大きなメモリ量が必要な場合には旧QuadroシリーズのGPUや、NVIDIA A100などのデータセンタ向けGPUが必要となります。
構成事例
1. RTX 3090 4枚搭載ディープラーニング用途 (画像処理)
お問い合わせ内容
ディープラーニング学習用途(画像処理)でGeForce RTX 3090を4枚搭載したGPU計算機。データの前処理などの関係で、CPUコア数やメモリ量もある程度必要。
ご提案構成
ご予算に合うようにCPUは64コアのEPYC 7742を1基搭載、メモリを512GB、GPUを当社水冷仕様のGeForce RTX 3090を4枚搭載した構成としました。GPU 4枚を並列に利用してもサーマルスロットリングは起こらず、高い演算性能を発揮させることができます。
主な仕様
- CPU: AMD EPYC 7742 64コア
- メモリ: 512GB DDR4-3200 8-channel
- Video: オンボードVGA
- GPU: 当社水冷 4x GeForce RTX 3090
- フルタワーケース
ベースモデル
GPU-EPYC1W-GF-LC (現行品ではGeForce RTX 4090 x3枚になります)
2. 水冷NVIDIA A100 4枚搭載ディープラーニング用途
お問い合わせ内容
NVIDIA A100 PCIeを4枚搭載したディープラーニング用GPUワークステーション。CPUに関してはコア数がそれほど必要はなく、PCIe Gen4でGPU 4枚利用可能でコストパフォーマンスが良いもの。メモリ容量もある程度必要。
ご提案構成
ご予算に合うようにCPUは16コアのThreadripper PRO 3955WXを1基搭載、メモリを512GB (ECC Registered)、GPUを当社水冷仕様のNVIDIA A100 40GB PCIeを4枚搭載した構成としました。
主な仕様
- CPU: Threadripper PRO 3955WX 16コア
- メモリ: 512GB DDR4-3200 8-channel (ECC Registered)
- Video: NVIDIA GeForce GT1030 2GB
- GPU: 当社水冷 4x NVIDIA A100 40GB PCIe
- フルタワーケース
ベースモデル
※本モデルは販売を終了しました
3. RTX 3080Ti 4枚搭載ディープラーニング用途 (自然言語処理、音声認識など)
お問い合わせ内容
ディープラーニングの学習用途(自然言語処理、音声認識など)でGeForce RTX 3080Tiを4枚搭載したGPU計算機。CPUはコア数がそれほど必要はなく、CPUコア当たりのクロック周波数が高いもの。
ご提案構成
ご予算に合うようにCPUは16コアのThreadripper PRO 3955WXを1基搭載、メモリを256GB、GPUを当社水冷仕様のGeForce RTX 3080Tiを4枚搭載した構成としました。
主な仕様
- CPU: Threadripper PRO 3955WX 16コア
- メモリ: 256GB DDR4-3200 8-channel (non-ECC)
- GPU: 当社水冷 4x GeForce RTX 3080Ti
- フルタワーケース
ベースモデル
GPU-TRPRO-GF-LC (現行品ではGeForce RTX 4090 x3枚になります)
本ページのハードウェア構成は納品当時の構成のため、最新のパーツではないことがあります。また同分野のアプリケーションであっても実際の性能は計算モデル、アルゴリズム、コンパイラ、ソルバーやライブラリ、ソースコードなどに依存するため、必ずしも最適な構成ではない場合があります。