跳到主要内容

CUDA/cuDNN 版本与安装说明

aifare 平台镜像已内置主流 CUDA/cuDNN 版本,绝大多数用户无需手动安装。如需自定义 CUDA/cuDNN 版本,可参考以下方法。

平台内置说明

  • 框架镜像已自动适配对应 CUDA/cuDNN 版本,无需单独安装
  • 仅在有二次编译/特殊需求时才需自定义 CUDA/cuDNN

查询当前 CUDA/cuDNN 版本

# 查询 CUDA 版本(以 /usr/local/ 目录为准)
ldconfig -p | grep cuda

# 查询 cuDNN 版本
ldconfig -p | grep cudnn
  • 结果中 .so 后的数字即为版本号
  • 注意:nvidia-smi 显示的是驱动支持的最高 CUDA 版本,不代表实际安装版本

Conda 安装 CUDA/cuDNN(推荐简单场景)

conda install cudatoolkit==11.3
conda install cudnn==8.2
  • 可用 conda search cudatoolkit 查询支持的版本
  • Conda 安装的 CUDA 一般不带头文件,不适合二次编译

手动下载安装包安装(适合需头文件/编译场景)

  1. 前往 NVIDIA CUDA Toolkit Archive 下载对应版本
  2. 赋予安装包执行权限并安装:
chmod +x cuda_xxx.run
./cuda_xxx.run # 只需安装 CUDA,不要安装驱动
  1. cuDNN 下载:NVIDIA cuDNN
    • 解压后将 include 和 lib64 文件分别复制到 /usr/local/cuda/include//usr/local/cuda/lib64/
mv cuda/include/* /usr/local/cuda/include/
chmod +x cuda/lib64/* && mv cuda/lib64/* /usr/local/cuda/lib64/
  1. 增加环境变量并刷新:
echo "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH}" >> ~/.bashrc
source ~/.bashrc && ldconfig

常见问题

  • Conda 安装的 cudatoolkit 优先级高于系统 CUDA,建议只保留一种方式
  • 平台镜像已内置最原生 CUDA/cuDNN,优先使用平台环境
  • 若需多版本 CUDA,请手动管理环境变量,避免冲突

如需更多 CUDA/cuDNN 配置技巧,请参考 aifare 平台文档或社区资源。