CUDA/cuDNN 版本与安装说明
aifare 平台镜像已内置主流 CUDA/cuDNN 版本,绝大多数用户无需手动安装。如需自定义 CUDA/cuDNN 版本,可参考以下方法。
平台内置说明
- 框架镜像已自动适配对应 CUDA/cuDNN 版本,无需单独安装
- 仅在有二次编译/特殊需求时才需自定义 CUDA/cuDNN
查询当前 CUDA/cuDNN 版本
# 查询 CUDA 版本(以 /usr/local/ 目录为准)
ldconfig -p | grep cuda
# 查询 cuDNN 版本
ldconfig -p | grep cudnn
- 结果中 .so 后的数字即为版本号
- 注意:nvidia-smi 显示的是驱动支持的最高 CUDA 版本,不代表实际安装版本
Conda 安装 CUDA/cuDNN(推荐简单场景)
conda install cudatoolkit==11.3
conda install cudnn==8.2
- 可用
conda search cudatoolkit查询支持的版本 - Conda 安装的 CUDA 一般不带头文件,不适合二次编译
手动下载安装包安装(适合需头文件/编译场景)
- 前往 NVIDIA CUDA Toolkit Archive 下载对应版本
- 赋予安装包执行权限并安装:
chmod +x cuda_xxx.run
./cuda_xxx.run # 只需安装 CUDA,不要安装驱动
- cuDNN 下载:NVIDIA cuDNN
- 解压后将 include 和 lib64 文件分别复制到
/usr/local/cuda/include/和/usr/local/cuda/lib64/
- 解压后将 include 和 lib64 文件分别复制到
mv cuda/include/* /usr/local/cuda/include/
chmod +x cuda/lib64/* && mv cuda/lib64/* /usr/local/cuda/lib64/
- 增加环境变量并刷新:
echo "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH}" >> ~/.bashrc
source ~/.bashrc && ldconfig
常见问题
- Conda 安装的 cudatoolkit 优先级高于系统 CUDA,建议只保留一种方式
- 平台镜像已内置最原生 CUDA/cuDNN,优先使用平台环境
- 若需多版本 CUDA,请手动管理环境变量,避免冲突
如需更多 CUDA/cuDNN 配置技巧,请参考 aifare 平台文档或社区资源。