コンテンツにスキップ

GPU

ABCIシステムでは、NVIDIAが提供する以下のライブラリが利用できます。

これらのライブラリを利用するためには、事前にmoduleコマンドを用いて利用環境を設定する必要があります。moduleコマンドを用いると、PATHなどの実行用環境変数や、ヘッダファイルやライブラリのサーチパスなどのコンパイル用環境変数を自動的に設定できます。

[username@g0001 ~]$ module load cuda/11.2/11.2.2
[username@g0001 ~]$ module load cudnn/8.1/8.1.1
[username@g0001 ~]$ module load nccl/2.8/2.8.4-1

以下では、ABCIシステムで利用可能なCUDA Toolkit、cuDNN、NCCLの一覧を示します。

CUDA Toolkit

Major version Minor version Available from NVIDIA Available on Compute Node (V) Available on Compute Node (A)
cuda/11.2 11.2.2 Yes Yes1 Yes
cuda/11.6 11.6.2 Yes Yes1 Yes
cuda/11.7 11.7.1 Yes Yes Yes
cuda/11.8 11.8.0 Yes Yes Yes
cuda/12.1 12.1.1 Yes Yes Yes
cuda/12.2 12.2.0 Yes Yes Yes
cuda/12.3 12.3.2 Yes Yes Yes
cuda/12.4 12.4.0 Yes Yes Yes

cuDNN

計算ノード(V):

Version cuda/11.21 cuda/11.61 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
8.1.1 Yes - - - - - - -
8.3.3 Yes Yes - - - - - -
8.4.1 Yes Yes Yes Yes - - - -
8.6.0 Yes Yes Yes Yes - - - -
8.7.0 Yes Yes Yes Yes - - - -
8.8.1 Yes Yes Yes Yes Yes Yes Yes Yes
8.9.7 Yes Yes Yes Yes Yes Yes Yes Yes
9.0.02 Yes Yes Yes Yes Yes Yes Yes Yes

計算ノード(A):

Version cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
8.1.1 Yes - - - - - - -
8.3.3 Yes Yes - - - - - -
8.4.1 Yes Yes Yes Yes - - - -
8.6.0 Yes Yes Yes Yes - - - -
8.7.0 Yes Yes Yes Yes - - - -
8.8.1 Yes Yes Yes Yes Yes Yes Yes Yes
8.9.7 Yes Yes Yes Yes Yes Yes Yes Yes
9.0.02 Yes Yes Yes Yes Yes Yes Yes Yes

NCCL

計算ノード(V):

Version cuda/11.21 cuda/11.61 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
2.8.4-1 Yes - - - - - - -
2.11.4-1 - Yes - - - - - -
2.12.12-1 - Yes - - - - - -
2.13.4-1 - - Yes - - - - -
2.14.3-1 - - Yes - - - - -
2.15.5-1 - - - Yes - - - -
2.16.2-1 - - - Yes - - - -
2.17.1-1 - - - - Yes - - -
2.18.5-1 - - - - - Yes - -
2.19.3-1 - - - - - Yes Yes -
2.20.5-1 - - - - - Yes - Yes

計算ノード(A):

Version cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
2.8.4-1 Yes - - - - - - -
2.11.4-1 - Yes - - - - - -
2.12.12-1 - Yes - - - - - -
2.13.4-1 - - Yes - - - - -
2.14.3-1 - - Yes - - - - -
2.15.5-1 - - - Yes - - - -
2.16.2-1 - - - Yes - - - -
2.17.1-1 - - - - Yes - - -
2.18.5-1 - - - - - Yes - -
2.19.3-1 - - - - - Yes Yes -
2.20.5-1 - - - - - Yes - Yes

GDRCopy

計算ノード(V):

Version gcc cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
2.4.1 8.5.0 Yes Yes Yes Yes Yes Yes Yes Yes
2.4.1 13.2.0 - - - - - - - Yes

計算ノード(A):

Version gcc cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
2.4.1 8.3.1 Yes Yes Yes Yes Yes Yes Yes Yes
2.4.1 13.2.0 - - - - - - - Yes

GPU Compute Modeの変更

ジョブ実行オプション -v GPU_COMPUTE_MODE=num を用いて、GPUのCompute Modeを変更することができます。以下の3つのCompute Modeが指定可能です。

オプション 説明
-v GPU_COMPUTE_MODE=0 DEFAULTモード。
1つのGPUを複数のプロセスから同時に利用できます。
-v GPU_COMPUTE_MODE=2 PROHIBITEDモード。
GPUへのプロセス割り当てを禁止します。
-v GPU_COMPUTE_MODE=3 EXCLUSIVE_PROCESSモード。
1つのGPUを1プロセスのみが利用できます。1プロセスから複数スレッドの利用は可能です。

インタラクティブ利用時の実行例:

[username@es1 ~]$ qrsh -g grpname -l rt_F=1 -l h_rt=1:00:00 -v GPU_COMPUTE_MODE=3

バッチ利用時の実行例:

#!/bin/bash

#$ -l rt_F=1
#$ -l h_rt=1:00:00
#$ -j y
#$ -cwd
#$ -v GPU_COMPUTE_MODE=3
/usr/bin/nvidia-smi

  1. 試験用に提供しています。Rocky Linux 8.6は、CUDA 11.7.1以降でサポートされます。 

  2. cuDNN 9.0.0をCUDA 11.0から11.3で使用した場合、cudnnRNNBackwardWeights_v8関数呼び出し時にエラーが発生することを確認しています。