Engineering/OS -Linux, Windows, EXSi

[nvidia-driver] ubuntu에 특정 버전의 nvidia driver 설치하기

알탱2 2024. 5. 6. 20:54
반응형

CUDA Version을 최신이 아닌 과거 버전으로 설치를 해야해서 nvidia driver 버전을 낮춰서 설치를 해야했다.

기존 설치 버전이 깔끔하게 삭제되지 않거나 reboot 을 안해서 였는지.. 몇 번의 삽질이 있었고, 아래의 방법으로 지금은 설치할 때마다 한번에 잘 설치하고 있다!

 

 

기존  버전 삭제

# 설치된 패키지 조회
sudo dpkg -l | grep nvidia

# nvidia 가 포함된 패키지 모두 삭제
sudo apt purge *nvidia*

# OS 재시작

sudo reboot

 

 

 

버전 지정하여 nvidia-driver 설치하기

# 470 버전으로 지정하여 설치하기
sudo apt install nvidia-driver-470

# docker container 에서 gpu 사용을 위해 toolkit 도 설치하기 
# 기존에 설치되어 있더라도 삭제하고 driver 설치 후 재설치하는 것을 추천!
sudo apt install nvidia-container-toolkit

 

!!! 만약 위에 toolkit 설치 시 에러가 발생한다면 아래와 같이 apt source 를 추가하고 다시 설치하자. 출처는 하단에 링크 첨부.

# 아래 4줄이 전체가 1줄이니 한번에 복붙!
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-c ontainer-toolkit-keyring.gpg && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-tool kit.list | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list

sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list

sudo apt-get update

sudo apt install nvidia-container-toolkit

# 설치가 완료되었다면 다시 한번 reboot
sudo reboot

 

참고 링크 : https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html#installing-with-apt

 

 

 

 

반응형