Blocco di sistema di fedora 30 ma anche 31

Salve a tutti. Mi son deciso a scrivervi perché non riesco a trovare una spiegazione al seguente comportamento: Fedora 30 - ma ora anche con 31 -, Mate DE, HP desktop 8GB ram; all’improvviso, qualsiasi cosa stia facendo, anche una semplice copia di un file, si blocca tutto e mi costringe a un riavvio forzato per scoprire che c’è un avviso di Dnfdragora di nuovi aggiornamenti. Qualcuno mi sa spiegare da cosa dipende questo comportamento ?
Grazie.
Luigi

Potrebbe dipendere, anzi dipende, senza dubbio dal fatto che il disco rigido sta tirando le cuoia. Mi è successa la stessa cosa: io uso abitualmente KDE e un bel giorno, durante una normale sessione di lavoro, non trovava più i files di configurazione dei vari programmi. Spengo e riavvio e il boot si fermava alle prime fasi. Per giunta, ma è avvenuto quasi in contemporanea, anche il PC stava morendo. Meno male che ne avevo ordinato uno nuovo! Soluzione? Ho usato RIP Linux per copiare il contenuto del disco morente in uno nuovo, sempre usando lo stesso ho riparato i blocchi danneggiati copiati sul nuovo. Ora il sistema funziona perfettamente… eccetto il fatto che mi sono dovuto ordinare un nuovo masterizzatore DVD oggi… Tranquillo, riuscirai a salvare tutto, fidati.

Ciao Luigi,
prova a vedere i valori SMART del tuo disco con:

# smartctl -a /dev/sdX

dove sdX va sostituito con il mount corretto del disco da esaminare, ad es /dev/sda, sdb, etc.
Puoi vedere qual’e’ il nome del tuo disco con una serie di comandi, tra cui ‘fdisk -l’, ‘df’, … oppure graficamente con gparted.

Bene, cioè… insomma, benino; almeno so da che dipende.
Ti ringrazio del chiarimento.
Un saluto. Ciao
Luigi

[quote=bebo_sudo]Ciao Luigi,
prova a vedere i valori SMART del tuo disco con:

# smartctl -a /dev/sdX

dove sdX va sostituito con il mount corretto del disco da esaminare, ad es /dev/sda, sdb, etc.
Puoi vedere qual’e’ il nome del tuo disco con una serie di comandi, tra cui ‘fdisk -l’, ‘df’, … oppure graficamente con gparted.[/quote]

Bene, eseguito.
Qui i risultati (se possibile chiariscimeli):

[code]
[root@pisola lu]# smartctl -a /dev/sdb
smartctl 7.0 2019-03-31 r4903 [x86_64-linux-5.3.8-300.fc31.x86_64] (local build)
Copyright © 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 3.5
Device Model: ST1000DM010-2EP102
Serial Number: Z9AAY823
LU WWN Device Id: 5 000c50 0a21954af
Firmware Version: CC43
User Capacity: 1.000.204.886.016 bytes [1,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Sun Nov 10 18:59:50 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 0) seconds.
Offline data collection
capabilities: (0x73) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 105) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x1085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 080 063 006 Pre-fail Always - 110477403
3 Spin_Up_Time 0x0003 097 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 097 097 020 Old_age Always - 3359
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 075 060 045 Pre-fail Always - 8657359148
9 Power_On_Hours 0x0032 093 093 000 Old_age Always - 6413
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 097 097 020 Old_age Always - 3361
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0 0 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 068 057 040 Old_age Always - 32 (Min/Max 24/32)
193 Load_Cycle_Count 0x0032 099 099 000 Old_age Always - 3363
194 Temperature_Celsius 0x0022 032 014 000 Old_age Always - 32 (0 14 0 0 0)
195 Hardware_ECC_Recovered 0x001a 002 001 000 Old_age Always - 110477403
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 6395h+34m+51.836s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 18260954748
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 24247196451

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error

1 Extended offline Completed without error 00% 4297 -

2 Short offline Completed without error 00% 4295 -

3 Short offline Completed without error 00% 3827 -

4 Short offline Completed without error 00% 3813 -

5 Short offline Completed without error 00% 3729 -

6 Short offline Completed without error 00% 3702 -

7 Short offline Completed without error 00% 3690 -

8 Short offline Completed without error 00% 3652 -

9 Short offline Completed without error 00% 572 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.[/code]

Attendo con ansia :wink:
Luigi

Un disco da 1TB! Oh mamma! Se ti tocca copiarlo per sicurezza ci vorranno massimo 12 ore, a occhio e croce! Un disco da 500 GB ha bisogno di metà del tempo…

Ma infatti io generalmente sono per i dischi di taglia piccola, almeno in caso di perdita i dati sono in numero minore.
Ma almeno qui a L’Aquila i fornitori ti dicono che hanno preso solo dischi da 1 tera perché costano quasi come quelli da 500 per cui…
Vabbè, va.
Luigi

Nell’attesa di qualcuno più esperto che confermi o smentisca la mia impressione, tenuto conto del fatto che l’ultimo test completo è stato “Completed without error”, hai provato a fare un test della RAM? Mi sembra che sia un’opzione delle live, oppure bisognerebbe installare memtest86+:

[code]# dnf install memtest86+

/usr/sbin/memtest-setup[/code]

Il test andrebbe eseguito per diverse ore (almeno tutta la notte, o un tempo equivalente), a meno che non dia subito errori.

N.B. Al momento, non avrei comunque certezze sulla causa del tuo problema, per cui seguirei tutte le piste possibili.

[quote=QuarkF]Nell’attesa di qualcuno più esperto che confermi o smentisca la mia impressione, tenuto conto del fatto che l’ultimo test completo è stato “Completed without error”, hai provato a fare un test della RAM? Mi sembra che sia un’opzione delle live, oppure bisognerebbe installare memtest86+:

[code]# dnf install memtest86+

/usr/sbin/memtest-setup[/code]

Il test andrebbe eseguito per diverse ore (almeno tutta la notte, o un tempo equivalente), a meno che non dia subito errori.

N.B. Al momento, non avrei comunque certezze sulla causa del tuo problema, per cui seguirei tutte le piste possibili.[/quote]

Ciao.
A quanto pare memtest86+ era già installato.
Questo il risultato:

lu@pisola ~]$ sudo /usr/sbin/memtest-setup ERROR: memtest86+ does not support EFI platforms

Comunque mi conforta il fatto che il test del disco ha dato risultato negativo.
Un saluto
Luigi

Il disco mi sembra a posto; per i valori da guardare vedi:
https://forum.fedoraonline.it/viewtopic.php?pid=250221#p250221

Domanda: che Desktop Environment usi? Io sto notando parecchi freeze con xfce da un paio di mesi.
Non e’ swap, perche’ il puntatore del mouse si muove benissimo, e la musica in sottofondo continua a scorrere, e anzi posso aprire una tty con ctrl+alt+f2/f3/etc e dare un killall xfce4-session, e rientrare (perdendo la sessione). Quando invece vado in swap non c’e’ modo di fare niente.
Devo ancora sperimentare con un DE diverso pero’.

Edit: vedo adesso che hai scritto che usi Mate. Confermi che quando si freeza non e’ un problema di memoria piena e quindi di swap? Cioe’, ti succede anche non facendo “niente”? Hai iniziato a notarlo da un certo periodo in poi?

potresti farci vedere un output, da root:

[code]# dnf install inxi

inxi -F[/code]

Sento puzza di blocchi danneggiati nel disco rigido…

[quote=bebo_sudo]Il disco mi sembra a posto; per i valori da guardare vedi:
https://forum.fedoraonline.it/viewtopic.php?pid=250221#p250221

Domanda: che Desktop Environment usi? Io sto notando parecchi freeze con xfce da un paio di mesi.
Non e’ swap, perche’ il puntatore del mouse si muove benissimo, e la musica in sottofondo continua a scorrere, e anzi posso aprire una tty con ctrl+alt+f2/f3/etc e dare un killall xfce4-session, e rientrare (perdendo la sessione). Quando invece vado in swap non c’e’ modo di fare niente.
Devo ancora sperimentare con un DE diverso pero’.

Edit: vedo adesso che hai scritto che usi Mate. Confermi che quando si freeza non e’ un problema di memoria piena e quindi di swap? Cioe’, ti succede anche non facendo “niente”? Hai iniziato a notarlo da un certo periodo in poi?[/quote]

Ciao. Confermo. Di swap c’ha 11 GB (pure eccessivi).
Bè, sono un po’ di mesi che lo sto notando in particolare; accadeva anche prima ma lo attribuivo a qualcos’altro, tipo a qualche mio errore.

[quote=beggar]potresti farci vedere un output, da root:

[code]# dnf install inxi

inxi -F[/code][/quote]

Ciao
Eccomi:

[root@pisola lu]# inxi -F
System:
  Host: pisola.localdomain Kernel: 5.3.9-300.fc31.x86_64 x86_64 bits: 64 
  Desktop: MATE 1.22.2 Distro: Fedora release 31 (Thirty One) 
Machine:
  Type: Desktop System: Hewlett-Packard product: HP Compaq Pro 6300 SFF v: N/A 
  serial: 2UA2500XYL 
  Mobo: Hewlett-Packard model: 339A serial: 2UA2500XYL UEFI: Hewlett-Packard 
  v: K01 v02.05 date: 05/07/2012 
CPU:
  Topology: Dual Core model: Intel Core i3-3220 bits: 64 type: MT MCP 
  L2 cache: 3072 KiB 
  Speed: 1597 MHz min/max: 1600/3300 MHz Core speeds (MHz): 1: 1596 2: 1596 3: 1596 
  4: 1596 
Graphics:
  Device-1: NVIDIA GK208B [GeForce GT 730] driver: nouveau v: kernel 
  Display: x11 server: Fedora Project X.org 1.20.5 driver: modesetting 
  unloaded: fbdev,vesa resolution: 1920x1080~60Hz 
  OpenGL: renderer: NV106 v: 4.3 Mesa 19.2.2 
Audio:
  Device-1: Intel 7 Series/C216 Family High Definition Audio driver: snd_hda_intel 
  Device-2: NVIDIA GK208 HDMI/DP Audio driver: snd_hda_intel 
  Sound Server: ALSA v: k5.3.9-300.fc31.x86_64 
Network:
  Device-1: Intel 82579LM Gigabit Network driver: e1000e 
  IF: eno1 state: down mac: b4:b5:2f:d8:e2:20 
  Device-2: Qualcomm Atheros AR9227 Wireless Network Adapter driver: ath9k 
  IF: wlp2s0 state: up mac: ec:08:6b:a0:4c:9a 
Drives:
  Local Storage: total: 1.82 TiB used: 397.54 GiB (21.3%) 
  ID-1: /dev/sda vendor: Western Digital model: WD10EZEX-08WN4A0 size: 931.51 GiB 
  ID-2: /dev/sdb vendor: Seagate model: ST1000DM010-2EP102 size: 931.51 GiB 
Partition:
  ID-1: / size: 70.95 GiB used: 26.51 GiB (37.4%) fs: ext4 dev: /dev/sdb7 
  ID-2: /boot size: 379.4 MiB used: 211.5 MiB (55.8%) fs: ext4 dev: /dev/sdb2 
  ID-3: swap-1 size: 9.92 GiB used: 0 KiB (0.0%) fs: swap dev: /dev/sdb5 
Sensors:
  System Temperatures: cpu: 29.8 C mobo: 27.8 C gpu: nouveau temp: 52 C 
  Fan Speeds (RPM): N/A 
Info:
  Processes: 237 Uptime: 5h 49m Memory: 7.72 GiB used: 1.44 GiB (18.6%) Shell: bash 
  inxi: 3.0.36

Ma inxi cos’è?

è un applicativo che fa una sintesi dell’hardware del tuo sistema

l’ho chiesto perchè c’è una vecchia https://bugzilla.kernel.org/show_bug.cgi?id=109051 di crash mate su schede grafiche intel
ma visto che hai una nvidia non dovrebbe interessarti.

… però un tentativo lo farei visto che hai una cpu intel, da root:

[code]

pluma /etc/default/grub[/code]

aggiungi alla linea
GRUB_CMDLINE_LINUX="…
il parametro

intel_idle.max_cstate=1

salva chiudi
poi ricostruisci il grub :

# grub2-mkconfig -o /boot/efi/EFI/fedora/grub.cfg 

dai un restart
devi come si comporta

[quote=beggar]è un applicativo che fa una sintesi dell’hardware del tuo sistema

l’ho chiesto perchè c’è una vecchia https://bugzilla.kernel.org/show_bug.cgi?id=109051 di crash mate su schede grafiche intel
ma visto che hai una nvidia non dovrebbe interessarti.

… però un tentativo lo farei visto che hai una cpu intel, da root:

[code]

pluma /etc/default/grub[/code]

aggiungi alla linea
GRUB_CMDLINE_LINUX="…
il parametro

intel_idle.max_cstate=1

salva chiudi
poi ricostruisci il grub :

# grub2-mkconfig -o /boot/efi/EFI/fedora/grub.cfg 

dai un restart
devi come si comporta[/quote]

Però io ho installato ReFind come boot loader. Può esser valida lo stesso la prova?

non conosco refind come bootloader
quindi non so quali sono i comandi equivalenti in questo contesto.

Domanda: ma prima di applicare la modifica a gub proposta da beggar non conviene provarla premendo “e” all’avvio di grub, editare al volo lo sript di avvio e testare il comportamento della macchina?

Poi se tutto va come deve andare si può applicare la modifica in modo permanente, altrimenti si lascia il file di avvio inalterato.

Vabbè, ragazzi.
Ho disabilitato senza tanti complimenti dalle Applicazioni d’avvio dnfdragora-updater e farò manualmente la ricerca di aggiornamenti.
Per ora tutto bene, poi vi farò sapere.
Grazie a tutti per i suggerimenti.
Luigi