rtx5070ti-ubuntu2404/README.md

2.3 KiB
Raw Permalink Blame History

Ubuntu 24.04.x + RTX 5070 Ti — Driver Ubuntu + CUDA 12.8 (NVIDIA) avec pinning APT

Contexte

Sur une installation Ubuntu “vanille”, la pile NVIDIA peut devenir instable si lon mélange des sources APT (Ubuntu vs dépôt CUDA NVIDIA) pour les composants driver (libs/utilitaires/modules). Cela peut mener à des conflits de dépendances ou à des upgrades qui régressent.

Choix darchitecture (solution testée)

Règle simple : une source unique par famille de composants.

  • Driver NVIDIA (modules kernel + libs + utils) : Ubuntu
  • CUDA Toolkit : dépôt NVIDIA (/usr/local/cuda-12.8)
  • Pinning APT : autoriser cuda-* depuis NVIDIA, empêcher NVIDIA de prendre la main sur nvidia-* et libnvidia-*

Ce que fait ce dépôt

  • setup-rtx5070ti-ubuntu2404.sh : installation complète (driver Ubuntu 580-open + CUDA 12.8 + pinning)
  • apt/99-nvidia-from-ubuntu-cuda-from-nvidia.pref : pinning APT
  • env/cuda-12-8.sh : environnement CUDA (PATH + LD_LIBRARY_PATH)
  • install.sh : déploie les artefacts dans /etc/...
  • Makefile : raccourcis (prereq/setup/apply/check/status)

Récupération du dépôt (Git)

  1. Installer make :
    sudo apt install -y make ca-certificates
  2. Cloner le dépôt :
    git clone https://forge.alliance-boreale.ca/Chezlepro/rtx5070ti-ubuntu2404.git
    cd rtx5070ti-ubuntu2404
  3. Installer make :
    sudo apt install -y make ca-certificates

Chemins recommandés

A) From scratch (recommandé)

  1. Baseline OS (mises à jour + kernel), reboot requis
  • make prereq
  • sudo reboot
  1. Installation complète, reboot requis
  • make setup
  1. Vérification
  • make check
  • (optionnel) make status

B) Appliquer seulement les artefacts /etc

  • make apply

Validation (résumé)

  • make check (recommandé)
    ou, en manuel :
  • nvidia-smi
  • nvcc --version
  • apt-cache policy libnvidia-gl-580 libnvidia-egl-gbm1 nvidia-driver-580-open nvidia-utils-580

Prérequis

  • Ubuntu 24.04.x (testé avec 24.04.3 LTS)
  • Accès Internet, sudo
  • Recommandé : Secure Boot OFF (trajet le plus déterministe)

Notes

  • nvidia-smi affiche “CUDA Version: …” : cest la capacité exposée par le driver, pas la version du toolkit installé.
    La version installée se valide avec nvcc --version.

Documentation détaillée :

  • docs/procedure-from-scratch.md
  • docs/validation.md