Info
計算ノードのサービス終了にともない、GPUは使用できません。
GPU
ABCIシステムでは、NVIDIAが提供する以下のライブラリが利用できます。
- CUDA Toolkit
- NVIDIA CUDA Deep Neural Network library (cuDNN)
- NVIDIA Collective Communications Library (NCCL)
- GDRCopy: A fast GPU memory copy library based on NVIDIA GPUDirect RDMA technology
これらのライブラリを利用するためには、事前にmoduleコマンドを用いて利用環境を設定する必要があります。moduleコマンドを用いると、PATHなどの実行用環境変数や、ヘッダファイルやライブラリのサーチパスなどのコンパイル用環境変数を自動的に設定できます。
[username@g0001 ~]$ module load cuda/11.2/11.2.2
[username@g0001 ~]$ module load cudnn/8.1/8.1.1
[username@g0001 ~]$ module load nccl/2.8/2.8.4-1
以下では、ABCIシステムで利用可能なCUDA Toolkit、cuDNN、NCCLの一覧を示します。
CUDA Toolkit
| Major version | Minor version | Available from NVIDIA | Available on Compute Node (V) | Available on Compute Node (A) |
|---|---|---|---|---|
| cuda/11.2 | 11.2.2 | Yes | Yes1 | Yes |
| cuda/11.6 | 11.6.2 | Yes | Yes1 | Yes |
| cuda/11.7 | 11.7.1 | Yes | Yes | Yes |
| cuda/11.8 | 11.8.0 | Yes | Yes | Yes |
| cuda/12.1 | 12.1.1 | Yes | Yes | Yes |
| cuda/12.2 | 12.2.0 | Yes | Yes | Yes |
| cuda/12.3 | 12.3.2 | Yes | Yes | Yes |
| cuda/12.4 | 12.4.0 | Yes | Yes | Yes |
| cuda/12.4 | 12.4.1 | Yes | Yes | Yes |
| cuda/12.5 | 12.5.0 | Yes | Yes | Yes |
| cuda/12.5 | 12.5.1 | Yes | Yes | Yes |
| cuda/12.6 | 12.6.1 | Yes | Yes | Yes |
cuDNN
計算ノード(V):
| Version | cuda/11.21 | cuda/11.61 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
|---|---|---|---|---|---|---|---|---|---|---|
| 8.1.1 | Yes | - | - | - | - | - | - | - | - | - |
| 8.3.3 | Yes | Yes | - | - | - | - | - | - | - | - |
| 8.4.1 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
| 8.6.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
| 8.7.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
| 8.8.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 8.9.7 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.0.02 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.1.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.2.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.3.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.4.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
計算ノード(A):
| Version | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
|---|---|---|---|---|---|---|---|---|---|---|
| 8.1.1 | Yes | - | - | - | - | - | - | - | - | - |
| 8.3.3 | Yes | Yes | - | - | - | - | - | - | - | - |
| 8.4.1 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
| 8.6.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
| 8.7.0 | Yes | Yes | Yes | Yes | - | - | - | - | - | - |
| 8.8.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 8.9.7 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.0.02 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.1.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.2.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.3.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 9.4.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
NCCL
計算ノード(V):
| Version | cuda/11.21 | cuda/11.61 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
|---|---|---|---|---|---|---|---|---|---|---|
| 2.8.4-1 | Yes | - | - | - | - | - | - | - | - | - |
| 2.11.4-1 | - | Yes | - | - | - | - | - | - | - | - |
| 2.12.12-1 | - | Yes | - | - | - | - | - | - | - | - |
| 2.13.4-1 | - | - | Yes | - | - | - | - | - | - | - |
| 2.14.3-1 | - | - | Yes | - | - | - | - | - | - | - |
| 2.15.5-1 | - | - | - | Yes | - | - | - | - | - | - |
| 2.16.2-1 | - | - | - | Yes | - | - | - | - | - | - |
| 2.17.1-1 | - | - | - | - | Yes | - | - | - | - | - |
| 2.18.5-1 | - | - | - | - | - | Yes | - | - | - | - |
| 2.19.3-1 | - | - | - | - | - | Yes | Yes | - | - | - |
| 2.20.5-1 | - | - | - | - | - | Yes | - | Yes | - | - |
| 2.21.5-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
| 2.22.3-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
計算ノード(A):
| Version | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 | cuda/12.5 | cuda/12.6 |
|---|---|---|---|---|---|---|---|---|---|---|
| 2.8.4-1 | Yes | - | - | - | - | - | - | - | - | - |
| 2.11.4-1 | - | Yes | - | - | - | - | - | - | - | - |
| 2.12.12-1 | - | Yes | - | - | - | - | - | - | - | - |
| 2.13.4-1 | - | - | Yes | - | - | - | - | - | - | - |
| 2.14.3-1 | - | - | Yes | - | - | - | - | - | - | - |
| 2.15.5-1 | - | - | - | Yes | - | - | - | - | - | - |
| 2.16.2-1 | - | - | - | Yes | - | - | - | - | - | - |
| 2.17.1-1 | - | - | - | - | Yes | - | - | - | - | - |
| 2.18.5-1 | - | - | - | - | - | Yes | - | - | - | - |
| 2.19.3-1 | - | - | - | - | - | Yes | Yes | - | - | - |
| 2.20.5-1 | - | - | - | - | - | Yes | - | Yes | - | - |
| 2.21.5-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
| 2.22.3-1 | - | - | - | - | - | Yes | - | Yes | Yes | - |
GDRCopy
計算ノード(V):
| Version | gcc | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 |
|---|---|---|---|---|---|---|---|---|---|
| 2.4.1 | 8.5.0 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 2.4.1 | 13.2.0 | - | - | - | - | - | - | - | Yes |
計算ノード(A):
| Version | gcc | cuda/11.2 | cuda/11.6 | cuda/11.7 | cuda/11.8 | cuda/12.1 | cuda/12.2 | cuda/12.3 | cuda/12.4 |
|---|---|---|---|---|---|---|---|---|---|
| 2.4.1 | 8.3.1 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 2.4.1 | 13.2.0 | - | - | - | - | - | - | - | Yes |
GPU Compute Modeの変更
ジョブ実行オプション -v GPU_COMPUTE_MODE=num を用いて、GPUのCompute Modeを変更することができます。以下の3つのCompute Modeが指定可能です。
| オプション | 説明 |
|---|---|
| -v GPU_COMPUTE_MODE=0 | DEFAULTモード。 1つのGPUを複数のプロセスから同時に利用できます。 |
| -v GPU_COMPUTE_MODE=2 | PROHIBITEDモード。 GPUへのプロセス割り当てを禁止します。 |
| -v GPU_COMPUTE_MODE=3 | EXCLUSIVE_PROCESSモード。 1つのGPUを1プロセスのみが利用できます。1プロセスから複数スレッドの利用は可能です。 |
インタラクティブ利用時の実行例:
[username@es1 ~]$ qrsh -g grpname -l rt_F=1 -l h_rt=1:00:00 -v GPU_COMPUTE_MODE=3
バッチ利用時の実行例:
#!/bin/bash
#$ -l rt_F=1
#$ -l h_rt=1:00:00
#$ -j y
#$ -cwd
#$ -v GPU_COMPUTE_MODE=3
/usr/bin/nvidia-smi