CUDA 管理 #
此部分内容容易引起错误导致训练环境崩溃,请谨慎操作。
目前安装有的共享 Cuda 位于 /share/opt/
,包含:
cuda-11.3.1
cuda-11.1.0
cuda-10.2
多版本 CUDA 安装 #
前往 官网 下载需要版本的 Cuda Toolkit,实验室服务器是 Ubuntu 18.04。
选 run_file(local)
这个版本。
下载完毕后,运行以下命令安装:
sudo sh cuda-x.x.run --silent --toolkit --toolkitpath=/share/opt/cuda-x.x
参数:
--toolkit
: 重要参数!!!,只安装 toolkit,不装显卡驱动。一定要包含这个。--silent
: 静默安装,不会显示过程。--toolkitpath
: 指定安装地址。
多版本 CUDA 切换 #
在 .bashrc
或 .zshrc
中添加以下内容
大部分情况设置这个应该就够了
export CUDA_HOME=/share/opt/cuda-11.3.1
如果不行,添加
export LD_LIBRARY_PATH=/share/opt/cuda-11.3.1/lib64:$LD_LIBRARY_PATH
export PATH=/share/opt/cuda-11.3.1/bin:$PATH