コンテンツにスキップ

GPU

ABCIシステムでは、NVIDIAが提供する以下のライブラリが利用できます。

これらのライブラリを利用するためには、事前にmoduleコマンドを用いて利用環境を設定する必要があります。moduleコマンドを用いると、PATHなどの実行用環境変数や、ヘッダファイルやライブラリのサーチパスなどのコンパイル用環境変数を自動的に設定できます。

[username@g0001 ~]$ module load cuda/11.2/11.2.2
[username@g0001 ~]$ module load cudnn/8.1/8.1.1
[username@g0001 ~]$ module load nccl/2.8/2.8.4-1

以下では、ABCIシステムで利用可能なCUDA Toolkit、cuDNN、NCCLの一覧を示します。

CUDA Toolkit

Major version Minor version Available from NVIDIA Available on Compute Node (V) Available on Compute Node (A)
cuda/11.2 11.2.2 Yes Yes1 Yes
cuda/11.6 11.6.2 Yes Yes1 Yes
cuda/11.7 11.7.1 Yes Yes Yes
cuda/11.8 11.8.0 Yes Yes Yes
cuda/12.1 12.1.1 Yes Yes Yes
cuda/12.2 12.2.0 Yes Yes Yes
cuda/12.3 12.3.2 Yes Yes Yes
cuda/12.4 12.4.0 Yes Yes Yes
cuda/12.4 12.4.1 Yes Yes Yes
cuda/12.5 12.5.0 Yes Yes Yes
cuda/12.5 12.5.1 Yes Yes Yes
cuda/12.6 12.6.1 Yes Yes Yes

cuDNN

計算ノード(V):

Version cuda/11.21 cuda/11.61 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4 cuda/12.5 cuda/12.6
8.1.1 Yes - - - - - - - - -
8.3.3 Yes Yes - - - - - - - -
8.4.1 Yes Yes Yes Yes - - - - - -
8.6.0 Yes Yes Yes Yes - - - - - -
8.7.0 Yes Yes Yes Yes - - - - - -
8.8.1 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
8.9.7 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.0.02 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.1.1 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.2.1 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.3.0 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.4.0 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes

計算ノード(A):

Version cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4 cuda/12.5 cuda/12.6
8.1.1 Yes - - - - - - - - -
8.3.3 Yes Yes - - - - - - - -
8.4.1 Yes Yes Yes Yes - - - - - -
8.6.0 Yes Yes Yes Yes - - - - - -
8.7.0 Yes Yes Yes Yes - - - - - -
8.8.1 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
8.9.7 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.0.02 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.1.1 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.2.1 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.3.0 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes
9.4.0 Yes Yes Yes Yes Yes Yes Yes Yes Yes Yes

NCCL

計算ノード(V):

Version cuda/11.21 cuda/11.61 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4 cuda/12.5 cuda/12.6
2.8.4-1 Yes - - - - - - - - -
2.11.4-1 - Yes - - - - - - - -
2.12.12-1 - Yes - - - - - - - -
2.13.4-1 - - Yes - - - - - - -
2.14.3-1 - - Yes - - - - - - -
2.15.5-1 - - - Yes - - - - - -
2.16.2-1 - - - Yes - - - - - -
2.17.1-1 - - - - Yes - - - - -
2.18.5-1 - - - - - Yes - - - -
2.19.3-1 - - - - - Yes Yes - - -
2.20.5-1 - - - - - Yes - Yes - -
2.21.5-1 - - - - - Yes - Yes Yes -
2.22.3-1 - - - - - Yes - Yes Yes -

計算ノード(A):

Version cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4 cuda/12.5 cuda/12.6
2.8.4-1 Yes - - - - - - - - -
2.11.4-1 - Yes - - - - - - - -
2.12.12-1 - Yes - - - - - - - -
2.13.4-1 - - Yes - - - - - - -
2.14.3-1 - - Yes - - - - - - -
2.15.5-1 - - - Yes - - - - - -
2.16.2-1 - - - Yes - - - - - -
2.17.1-1 - - - - Yes - - - - -
2.18.5-1 - - - - - Yes - - - -
2.19.3-1 - - - - - Yes Yes - - -
2.20.5-1 - - - - - Yes - Yes - -
2.21.5-1 - - - - - Yes - Yes Yes -
2.22.3-1 - - - - - Yes - Yes Yes -

GDRCopy

計算ノード(V):

Version gcc cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
2.4.1 8.5.0 Yes Yes Yes Yes Yes Yes Yes Yes
2.4.1 13.2.0 - - - - - - - Yes

計算ノード(A):

Version gcc cuda/11.2 cuda/11.6 cuda/11.7 cuda/11.8 cuda/12.1 cuda/12.2 cuda/12.3 cuda/12.4
2.4.1 8.3.1 Yes Yes Yes Yes Yes Yes Yes Yes
2.4.1 13.2.0 - - - - - - - Yes

GPU Compute Modeの変更

ジョブ実行オプション -v GPU_COMPUTE_MODE=num を用いて、GPUのCompute Modeを変更することができます。以下の3つのCompute Modeが指定可能です。

オプション 説明
-v GPU_COMPUTE_MODE=0 DEFAULTモード。
1つのGPUを複数のプロセスから同時に利用できます。
-v GPU_COMPUTE_MODE=2 PROHIBITEDモード。
GPUへのプロセス割り当てを禁止します。
-v GPU_COMPUTE_MODE=3 EXCLUSIVE_PROCESSモード。
1つのGPUを1プロセスのみが利用できます。1プロセスから複数スレッドの利用は可能です。

インタラクティブ利用時の実行例:

[username@es1 ~]$ qrsh -g grpname -l rt_F=1 -l h_rt=1:00:00 -v GPU_COMPUTE_MODE=3

バッチ利用時の実行例:

#!/bin/bash

#$ -l rt_F=1
#$ -l h_rt=1:00:00
#$ -j y
#$ -cwd
#$ -v GPU_COMPUTE_MODE=3
/usr/bin/nvidia-smi

  1. 試験用に提供しています。Rocky Linux 8.6は、CUDA 11.7.1以降でサポートされます。 

  2. cuDNN 9.0.0をCUDA 11.0から11.3で使用した場合、cudnnRNNBackwardWeights_v8関数呼び出し時にエラーが発生することを確認しています。