機械学習・ディープラーニング向け構成事例

Deep Learningの学習用途で、同一マシンにGPUを複数枚搭載する構成の事例です。個々のGPUで独立して計算を実行する場合や、複数のGPUを使って並列に計算する場合があります。CPUとGPUの間のPCIe帯域幅の重要性は、同一マシンに搭載された複数GPUの使い方、計算させるモデルやネットワークの構成によります。PCIeでの転送時間がGPU上での計算よりも圧倒的に短い場合や、独立したモデルを各GPUに割り振って計算させる場合にはPCIeの帯域幅がそれほど重視されないこともあります。

Deep Learningの学習で要求されるGPUメモリ量は、計算させるモデルやネットワークの構成、入力データなどによって異なります。それほどGPUのメモリ量が必要でなければGeForceの費用対効果が高く、一方で物体検出など比較的大きなメモリ量が必要な場合には旧QuadroシリーズのGPUや、NVIDIA A100などのデータセンタ向けGPUが必要となります。

構成事例

1. RTX 3090 4枚搭載ディープラーニング用途 (画像処理)

お問い合わせ内容

ディープラーニング学習用途（画像処理）でGeForce RTX 3090を4枚搭載したGPU計算機。データの前処理などの関係で、CPUコア数やメモリ量もある程度必要。

ご提案構成

ご予算に合うようにCPUは64コアのEPYC 7742を1基搭載、メモリを512GB、GPUを当社水冷仕様のGeForce RTX 3090を4枚搭載した構成としました。GPU 4枚を並列に利用してもサーマルスロットリングは起こらず、高い演算性能を発揮させることができます。

主な仕様

CPU: AMD EPYC 7742 64コア
メモリ: 512GB DDR4-3200 8-channel
Video: オンボードVGA
GPU: 当社水冷 4x GeForce RTX 3090
フルタワーケース

ベースモデル

GPU-EPYC1W-GF-LC (現行品ではGeForce RTX 4090 x3枚になります)

2. 水冷NVIDIA A100 4枚搭載ディープラーニング用途

お問い合わせ内容

NVIDIA A100 PCIeを4枚搭載したディープラーニング用GPUワークステーション。CPUに関してはコア数がそれほど必要はなく、PCIe Gen4でGPU 4枚利用可能でコストパフォーマンスが良いもの。メモリ容量もある程度必要。

ご提案構成

ご予算に合うようにCPUは16コアのThreadripper PRO 3955WXを1基搭載、メモリを512GB (ECC Registered)、GPUを当社水冷仕様のNVIDIA A100 40GB PCIeを4枚搭載した構成としました。

主な仕様

CPU: Threadripper PRO 3955WX 16コア
メモリ: 512GB DDR4-3200 8-channel (ECC Registered)
Video: NVIDIA GeForce GT1030 2GB
GPU: 当社水冷 4x NVIDIA A100 40GB PCIe
フルタワーケース

ベースモデル

※本モデルは販売を終了しました

3. RTX 3080Ti 4枚搭載ディープラーニング用途 (自然言語処理、音声認識など)

お問い合わせ内容

ディープラーニングの学習用途（自然言語処理、音声認識など）でGeForce RTX 3080Tiを4枚搭載したGPU計算機。CPUはコア数がそれほど必要はなく、CPUコア当たりのクロック周波数が高いもの。

ご提案構成

ご予算に合うようにCPUは16コアのThreadripper PRO 3955WXを1基搭載、メモリを256GB、GPUを当社水冷仕様のGeForce RTX 3080Tiを4枚搭載した構成としました。

主な仕様

CPU: Threadripper PRO 3955WX 16コア
メモリ: 256GB DDR4-3200 8-channel (non-ECC)
GPU: 当社水冷 4x GeForce RTX 3080Ti
フルタワーケース

ベースモデル

GPU-TRPRO-GF-LC (現行品ではGeForce RTX 4090 x3枚になります)

本ページのハードウェア構成は納品当時の構成のため、最新のパーツではないことがあります。また同分野のアプリケーションであっても実際の性能は計算モデル、アルゴリズム、コンパイラ、ソルバーやライブラリ、ソースコードなどに依存するため、必ずしも最適な構成ではない場合があります。