Cuda

CUDA 管理 #

此部分内容容易引起错误导致训练环境崩溃,请谨慎操作。

目前安装有的共享 Cuda 位于 /share/opt/ ,包含:

cuda-11.3.1
cuda-11.1.0
cuda-10.2

多版本 CUDA 安装 #

前往 官网 下载需要版本的 Cuda Toolkit,实验室服务器是 Ubuntu 18.04。

run_file(local) 这个版本。

下载完毕后,运行以下命令安装:

sudo sh cuda-x.x.run --silent --toolkit --toolkitpath=/share/opt/cuda-x.x

参数:

  • --toolkit: 重要参数!!!,只安装 toolkit,不装显卡驱动。一定要包含这个
  • --silent: 静默安装,不会显示过程。
  • --toolkitpath: 指定安装地址。

多版本 CUDA 切换 #

.bashrc.zshrc 中添加以下内容

大部分情况设置这个应该就够了

export CUDA_HOME=/share/opt/cuda-11.3.1 

如果不行,添加

export LD_LIBRARY_PATH=/share/opt/cuda-11.3.1/lib64:$LD_LIBRARY_PATH
export PATH=/share/opt/cuda-11.3.1/bin:$PATH

参考资料 #

累计访问: