GPU
ABCIシステムでは、NVIDIAが提供する以下のライブラリが利用できます。
- CUDA Toolkit
- NVIDIA CUDA Deep Neural Network library (cuDNN)
- NVIDIA Collective Communications Library (NCCL)
- GDRCopy: A fast GPU memory copy library based on NVIDIA GPUDirect RDMA technology
これらのライブラリを利用するためには、事前にmodule
コマンドを用いて利用環境を設定する必要があります。module
コマンドを用いると、PATH
などの実行用環境変数や、ヘッダファイルやライブラリのサーチパスなどのコンパイル用環境変数を自動的に設定できます。
[username@g0001 ~]$ module load cuda/11.2/11.2.2
[username@g0001 ~]$ module load cudnn/8.1/8.1.1
[username@g0001 ~]$ module load nccl/2.8/2.8.4-1
以下では、ABCIシステムで利用可能なCUDA Toolkit、cuDNN、NCCLの一覧を示します。
CUDA Toolkit
Major version | Minor version | Available from NVIDIA | Available on Compute Node (V) | Available on Compute Node (A) |
---|---|---|---|---|
cuda/11.2 | 11.2.2 | Yes | Yes1 | Yes |
cuda/11.6 | 11.6.2 | Yes | Yes1 | Yes |
cuda/11.7 | 11.7.1 | Yes | Yes | Yes |
cuda/11.8 | 11.8.0 | Yes | Yes | Yes |
cuda/12.1 | 12.1.1 | Yes | Yes | Yes |
cuda/12.2 | 12.2.0 | Yes | Yes | Yes |
cuda/12.3 | 12.3.2 | Yes | Yes | Yes |
cuda/12.4 | 12.4.0 | Yes | Yes | Yes |
cuda/12.4 | 12.4.1 | Yes | Yes | Yes |
cuda/12.5 | 12.5.0 | Yes | Yes | Yes |
cuda/12.5 | 12.5.1 | Yes | Yes | Yes |
cuda/12.6 | 12.6.1 | Yes | Yes | Yes |
cuDNN
計算ノード(V):
Version | cuda/11.21 | cuda/11.61 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
---|---|---|---|---|---|---|---|---|---|---|
8.1.1 | Yes | - | - | - | - | - | - | - | - | - |
8.3.3 | Yes | Yes | - | - | - | - | - | - | - | - |
8.4.1 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
8.6.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
8.7.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
8.8.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
8.9.7 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.0.02 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.1.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.2.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.3.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.4.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
計算ノード(A):
Version | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
---|---|---|---|---|---|---|---|---|---|---|
8.1.1 | Yes | - | - | - | - | - | - | - | - | - |
8.3.3 | Yes | Yes | - | - | - | - | - | - | - | - |
8.4.1 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
8.6.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
8.7.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
8.8.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
8.9.7 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.0.02 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.1.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.2.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.3.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
9.4.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
NCCL
計算ノード(V):
Version | cuda/11.21 | cuda/11.61 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
---|---|---|---|---|---|---|---|---|---|---|
2.8.4-1 | Yes | - | - | - | - | - | - | - | - | - |
2.11.4-1 | - | Yes | - | - | - | - | - | - | - | - |
2.12.12-1 | - | Yes | - | - | - | - | - | - | - | - |
2.13.4-1 | - | - | Yes | - | - | - | - | - | - | - |
2.14.3-1 | - | - | Yes | - | - | - | - | - | - | - |
2.15.5-1 | - | - | - | Yes | - | - | - | - | - | - |
2.16.2-1 | - | - | - | Yes | - | - | - | - | - | - |
2.17.1-1 | - | - | - | - | Yes | - | - | - | - | - |
2.18.5-1 | - | - | - | - | - | Yes | - | - | - | - |
2.19.3-1 | - | - | - | - | - | Yes | Yes | - | - | - |
2.20.5-1 | - | - | - | - | - | Yes | - | Yes | - | - |
2.21.5-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
2.22.3-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
計算ノード(A):
Version | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
---|---|---|---|---|---|---|---|---|---|---|
2.8.4-1 | Yes | - | - | - | - | - | - | - | - | - |
2.11.4-1 | - | Yes | - | - | - | - | - | - | - | - |
2.12.12-1 | - | Yes | - | - | - | - | - | - | - | - |
2.13.4-1 | - | - | Yes | - | - | - | - | - | - | - |
2.14.3-1 | - | - | Yes | - | - | - | - | - | - | - |
2.15.5-1 | - | - | - | Yes | - | - | - | - | - | - |
2.16.2-1 | - | - | - | Yes | - | - | - | - | - | - |
2.17.1-1 | - | - | - | - | Yes | - | - | - | - | - |
2.18.5-1 | - | - | - | - | - | Yes | - | - | - | - |
2.19.3-1 | - | - | - | - | - | Yes | Yes | - | - | - |
2.20.5-1 | - | - | - | - | - | Yes | - | Yes | - | - |
2.21.5-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
2.22.3-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
GDRCopy
計算ノード(V):
Version | gcc | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 |
---|---|---|---|---|---|---|---|---|---|
2.4.1 | 8.5.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
2.4.1 | 13.2.0 | - | - | - | - | - | - | - | Yes |
計算ノード(A):
Version | gcc | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 |
---|---|---|---|---|---|---|---|---|---|
2.4.1 | 8.3.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
2.4.1 | 13.2.0 | - | - | - | - | - | - | - | Yes |
GPU Compute Modeの変更
ジョブ実行オプション -v GPU_COMPUTE_MODE=num
を用いて、GPUのCompute Modeを変更することができます。以下の3つのCompute Modeが指定可能です。
オプション | 説明 |
---|---|
-v GPU_COMPUTE_MODE=0 | DEFAULTモード。 1つのGPUを複数のプロセスから同時に利用できます。 |
-v GPU_COMPUTE_MODE=2 | PROHIBITEDモード。 GPUへのプロセス割り当てを禁止します。 |
-v GPU_COMPUTE_MODE=3 | EXCLUSIVE_PROCESSモード。 1つのGPUを1プロセスのみが利用できます。1プロセスから複数スレッドの利用は可能です。 |
インタラクティブ利用時の実行例:
[username@es1 ~]$ qrsh -g grpname -l rt_F=1 -l h_rt=1:00:00 -v GPU_COMPUTE_MODE=3
バッチ利用時の実行例:
#!/bin/bash
#$ -l rt_F=1
#$ -l h_rt=1:00:00
#$ -j y
#$ -cwd
#$ -v GPU_COMPUTE_MODE=3
/usr/bin/nvidia-smi