Driver NVIDIA non funzionanti su Fedora 36

Ieri pomeriggio, a tre giorni dal rilascio ufficiale di Fedora 36, ho deciso di eseguire l’aggiornamento di sistema.

Premetto solo che per poter eseguire l’aggiornamento ho dovuto da subito disinstallare Jellyfin, in quanto la versione aggiornata di una sua dipendenza fornisce una libreria che il programma non riconosce più come valida… resto in attesa (spero non per troppo) della nuova versione del programma che dovrebbe risolvere il problema.
Così come resto in attesa che i repository di MEGASync si allineino alla nuova versione di Fedora.

L’unica cosa che purtroppo mi ha dato l’impressione di un “regresso” sono stati i problemi riscontrati con i soliti driver proprietari NVIDIA… mi è sembrato di essere tornato a qualche anno fa, quando questo tipo di problemi erano un’amara consuetudine ad ogni aggiornamento del kernel (o quasi).

Con il kernel 5.17.6 infatti (ma in rete ho visto che il problema si presentava anche con il 5.17.5 con il rilascio in beta), venivano abilitati i driver nouveau già al caricamento di plymouth… venivano perché nel tentativo di risolvere il problema ho fatto qualche prova a rimuovere e reinstallare i driver NVIDIA ma, se prima venivano abilitati i driver nouveau come metodo di ripiego, adesso compare soltanto una desolante schermata nera alla quale mi ero disabituato già da qualche rilascio di Fedora.

Incrocio le dita, sperarando nel rilascio in breve termine di una nuova versione del kernel che possa risolvere questo problema che stranamente si è presentato solo con Fedora 36… su Fedora 35 infatti, avevo ricevuto l’aggiornamento al kernel 5.17.6 proprio il giorno prima senza riscontrare alcun problema di sorta.

Dai un’occhiata qui

https://rpmfusion.org/CommonBugs

Io ho avuto un problema analogo con la mia NVIDIA GeForce GTX 1650; per risolvere ho dovuto dare un
dnf remove remove xorg-x11-drv-nvidia.x86_64
e poi
dnf install xorg-x11-drv-nvidia-470xx akmod-nvidia-470xx

non so se tra le varie prove che hai fatte ti è capitato di dare questi comandi (ammesso che i driver 470 vadano bene per la tua scheda video naturalmente)

@jack_71 avendo una GeForce GT 730 è un imprevisto nel quale sono incappato già in seguito all’aggiornamento dalla 34 alla 35. La versione 470.xx dei driver infatti, è proprio quella che avevo installata prima dell’aggiornamento alla 36.

@alciregi grazie per la risposta, se solo avessi notato prima questo link sul sito di rpmfusion forse sarei stato in grado di risolvere già da subito… l’errore che mi restituiva in fase di avvio infatti, prima di ripiegare sui driver nouveau, era proprio che non fosse presente il modulo nvidia.

Ho fatto un tentativo ad utilizzare depmod -ae come consigliato (e a reinstallare il kernel), ma purtroppo non è stato risolutivo.

La cosa strana è che se prima il sistema ripiegava in automatico su nouveau, già dopo il primo tentativo di rimuovere i driver nvidia, per poter avviare il sistema mi è toccato modificare i parametri di avvio di grub perché, nonostante la rimozione dei driver nvidia, non erano state rimosse le stringhe che blacklistano nouveau dal file di configurazione di grub.
Reistallando i driver invece, mi è toccato addirittura rimuovere alcune stringhe che si erano duplicate.

Ho poi fatto svariati tentativi a rimuovere e reinstallare i driver… memore degli svariati problemi che si riscontravano in passato con i driver nvidia ho provato i classici comandi che spesso erano risolutivi nel risolverli
akmods --force
dracut --regenerate--all --force

ma niente, non c’è stato verso di farli funzionare… a meno che non abbia fatto qualche casino con il file di configurazione di grub, ma direi che per ora ho già perso la pazienza e non mi va proprio di fare ulteriori tentativi.
Spero solo che con il rilascio del prossimo kernel ci sia qualche possibilità di trovare una soluzione al problema.

Un breve (e triste) aggiornamento sul problema che sto riscontrando.

Tra gli aggiornamenti disponibili oggi era presente il kernel 5.17.7 e, ovviamente, ho fatto un ulteriore tentativo ad installare i driver proprietari nvidia.

Purtroppo la situazione non è migliorata, all’avvio solita schermata nera… neppure plymouth viene visualizzato correttamente.

Stasera però ho dovuto allontanarmi dal PC per qualche minuto e quando sono tornato, dopo aver interrotto il blocco schermo, ho intravisto la schermata di login.

Apparentemente i driver sembrano funzionare, l’unica stranezza è che ad ogni avvio del PC devo attendere (all’incirca una ventina di minuti) che lo schermo vada in bloccho e, successivamente, interrompendo il blocco (muovendo il mouse ad esempio) riesco solo a quel punto a visualizzare la schermata di login per accedere alla sessione.

È evidente che ci sia un problema con i driver proprietari (con nouveau non si presenta questo tipo di problema), quello che non mi è del tutto chiaro è se il problema possa essere imputabile esclusivamente ai driver proprietari o se eventualmente possano esserci problemi anche con altre componenti come plymouth (o magari lightdm).

Per ora mi vedo comunque costretto a dover rimuovere nuovamente i driver proprietari… non mi sembra affatto che 20 minuti siano un tempo ragionevole di attesa per poter accedere al PC.

Vi aggiorno sulla situazione dato che, a quanto pare (come purtroppo temevo) esiste effettivamente un problema a livello di kernel…

Oggi, dopo l’ennesimo tentativo di installare i driver nvidia, ho inviato una segnalazione sul bugzilla di rpmfusiom allegando un bug report che allego anche qui

https://paste.centos.org/view/f81dc016

Nel giro di un paio di minuti ho ricevuto questa risposta:

The simpledrm fix should be in 5.17.10

https://gitlab.com/cki-project/kernel-ark/-/merge_requests/1788

That should fix most issues.

https://bugzilla.rpmfusion.org/show_bug.cgi?id=6303#c7

Dovrò semplicemente attendere fino al rilascio del kernel 5.17.10 per avere una risoluzione a questo problema.

Problemi risolti con il fix del driver SimpleDRM introdotto sulla versione 5.17.11 del kernel ricevuta oggi tra gli aggiornamenti.

L’avvio del sistema ora è molto più rapido… impiega alcuni secondi in più rispetto all’avvio con nouveau, ma per fortuna tutto sembra avviarsi normalmente e senza intoppi (almeno per ora).