前言

长话短说~

NVIDIA 显卡驱动安装

禁用 nouveau 通用驱动

  1. 编辑驱动控制文件
1
sudo vim /etc/modprobe.d/blacklist.conf
  1. 然后我们在文件最后中加入两行配置
1
2
3
# Block nouveau
blacklist nouveau
options nouveau modeset=0
  1. 应用驱动更新,然后重启
1
2
sudo update-initramfs -u
sudo reboot
  1. 输入代码没回显即可
1
lsmod | grep nouveau

下载驱动

1
https://www.nvidia.cn/Download/index.aspx?lang=cn

安装驱动准备

gcc

1
2
3
sudo apt-get update
sudo apt-get install gcc
sudo ln -s /usr/bin/gcc /usr/bin/cc

make

1
2
sudo apt-get update
sudo apt-get install make

pkg-config

1
2
sudo apt-get update
sudo apt-get install pkg-config

XOrg

1
2
3
sudo apt-get update
sudo apt-get install xorg-dev
sudo apt-get install --reinstall xserver-xorg

安装驱动

1
sudo bash ./NVIDIA-Linux-x86_64-<Driver_Version>.run -no-x-check -no-nouveau-check -no-opengl-files –no-cc-version-check

CUDA 模块

建议安装 CUDA 版本要 <= nvidia-smi 显示版本

apt 安装

  1. 直接可以 apt 安装
1
sudo apt install nvidia-cuda-toolkit
  1. 查看 CUDA 版本
  • 版本太旧,默认 11.6
1
nvcc --version

手动安装

  1. 获取 CUDA 安装包
1
https://developer.nvidia.com/cuda-toolkit-archive
  1. 下载 CUDA 工具包
1
2
3
4
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-3

配置 CUDA 环境变量

  1. 查找 CUDA 安装目录
  • 其实并不准
1
which nvcc
1
whereis cuda
  1. 编辑 .bashrc 文件
1
sudo vim ~/.bashrc
  1. 在文件末尾添加以下内容
1
2
3
export PATH=/usr/local/cuda-12.3/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.3/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-12.3
  1. 刷新当前终端会话,以使新的环境变量生效
1
source ~/.bashrc

安装完成

nvidia-smi

1
nvidia-smi

nvcc --version

1
nvcc --version

参考 & 引用

https://zhuanlan.zhihu.com/p/639204431
https://www.javabase.cn/docs/devops/dell/esxi-ubuntu-tesla-p40
https://post.smzdm.com/p/akkwdrqe/
https://blog.csdn.net/Sihang_Xie/article/details/127347139