水冷マルチGPU計算機の特徴

水冷GeForce RTX 4090を搭載した弊社のマルチGPUタワー型計算機製品の特徴を紹介いたします。

GPU温度を低く保ちサーマルスロットリングを抑制
高いコストパフォーマンス
騒音と設置場所
冷却液補充時期の通知
各種ソフトウェアのプリインストール

GPU温度を低く保ちサーマルスロットリングを抑制

広く流通している内排気空冷のRTX 4090を複数枚搭載すると高負荷時にGPUから発生する熱をケースから逃がし切れず、サーマルスロットリングの発生を避けることが非常に難しいです。

弊社水冷マルチGPU計算機ではRTX 4090 4枚に非常に高い負荷をかけた状態でもGPU温度を75℃程度に抑えており、サーマルスロットリングを発生させることなく利用することができます。高負荷時のGPU温度の動作テストの詳細なデータはこちらのページをご参照ください。

高いコストパフォーマンス

データセンタ向けやエンタープライズ向けのGPUは一般的に大容量のECC付メモリを搭載し、ハードウェアの信頼性や性能に対する消費電力の低さといったさまざまな点で優れています。一方、GeForce RTX 4090は比較的価格が安い点が最大のメリットで、通常の単精度浮動小数点の演算性能も十分に高いです。RTX 4090はミッションクリティカルな用途や大容量のGPUメモリが必要なアプリケーションに関しては不向きですが、テスト的な研究開発向けの用途でGPUメモリが24GBで十分な場合には低コストでGPUの高い演算能力を活用することができます。

また、空冷のRTX 4090では前述のとおりGPU温度の問題で搭載台数に制限があることが多く、マシン自体を複数台用意することになります。水冷マルチGPU計算機ではマシン1台に複数RTX 4090を搭載することができるため、マシンの管理コストを下げられます。マルチGPUを並列に利用できるアプリケーションはもちろんのこと、研究室や研究グループなど少人数でGPUを利用する場合もGPUに対応したジョブスケジューラ（SlurmやOpenPBS）を使うことでGPUリソースを有効に活用することができます。

騒音と設置場所

弊社水冷マルチGPU計算機は大型のフルタワーケースです。GPUの発熱量が大きいために騒音も大きいですが、搭載されているケースファンは120mm以上なので1Uや2Uのラックマウント型サーバのような高い周波数の大きな騒音ではありません。専用のサーバルームのような防音設備がない場所でも計算機を設置することができます。

ただし、静かな部屋のデスクサイドで使用すると騒音が大きいと感じられる場合が多いため、部屋の隅や多少騒音が出ても支障のない実験室などに設置することをお勧めしております（騒音はGPUの搭載枚数によります）。

冷却液補充時期の通知

弊社水冷GPU計算機では専用冷却液の補充が必要です。冷却液補充までの期間は使用方法や設置場所で変動しますが、大体2年程度が目安になります。冷却液が不足するとポンプの空回りによる故障やGPUのオーバーヒートによる故障が発生してしまいます。そのため、弊社水冷GPU計算機では冷却液の補充が必要な時期をお知らせする以下の2種類の通知方法が実装されています。

一つ目の通知方法は物理的な方法で、冷却液が少なくなるとマシン本体の背面に搭載されたLEDが点灯しブザーが鳴動します。マシンの設置場所が頻繁に人が出入りする場所（居室や実験室など）であれば、ブザーの音で冷却液が不足していることが分かり、LEDによる目視確認もできます。計算機を手元に設置せずブザーやLEDを頻繁に確認できない場合は、次のOS上の通知で確認することができます。

もう一つの通知方法はソフトウェア的な方法で、OS上の特定のログファイル（およびsyslog）に冷却液の状態が一定時間ごとに出力されます。マシン本体のブザーの鳴動やLEDの点灯が確認できない場所に設置した場合でも、定期的にログをチェックすることで冷却液の状態を確認することができます。また、ログ出力頻度やログメッセージは変更可能です。お客様の方で適宜シェルスクリプト等を作成することで、ログ出力をもとにメールで通知するといったことも可能です。

各種ソフトウェアのプリインストール

Linux OS（UbuntuやRockyLinux等）にNVIDIAドライバ、CUDAおよび関連ライブラリをインストールし、出荷前に負荷テストをはじめとした各種動作確認を行って出荷いたします。無償オプションでDockerやSingularityのプリインストールなどにもご対応いたしますので、お手元に届いてからすぐに利用することができます。

また、MinicondaやAnacondaなどの開発環境、GPUリソース対応のジョブスケジューラ（slurm、OpenPBS）、単精度浮動小数点を用いるCUDA対応の数値計算ソフトウェアといった各種ソフトウェアもオプションでご対応いたします。ご希望のソフトウェアや設定内容などがあればご相談ください。