Crash durante aggiornamento e bug

Ciao ragazzi,

Da molto tempo non posto, ed è un piacere rifarlo… L’incasinamento mi rende sempre difficile passare se non ho bisogno, ma mi mancava.

Volevo chiedere un parere su questa cosa che mi è capitata: qualche giorno fa durante un aggiornamento normale è crashata Fedora. Crash notevole, cioè zero possibilità di Alt+F2, e niente mouse.

Girando nella documentazione l’unico riferimento che ho trovato era a https://bugzilla.redhat.com/show_bug.cgi?id=1600917, che sembra affliggere distro che siano state aggiornate da versioni precedenti, ed è questo il mio caso. Ho provato a commentare il bug, ma non ho avuto riscontro.

Mi piacerebbe capire se sia possibile che il bug non causi solo crash a DNF ma anche al sistema, e se il consiglio di eliminare la cronologia di DNF sia sensato e quali rischi o controindicazioni comporti.

Un caro saluto a tutti, e mi piacerebbe rivedere qualcuno di voi, se si dovesse combinare nel milanese…
Giampaolo

Ciao, non ho capito se stessi aggiornando dei pacchetti con ‘dnf update’ o se stessi passando di versione da f29->f30.

Vediamo poi inoltre:

$ rpm -q {,lib}dnf

Ciao Bebo,

Non speravo quasi più in una risposta XD

Era un semplice dnf update.

Ecco il risultato del comando:

dnf-4.2.5-3.fc29.noarch
libdnf-0.31.0-5.fc29.x86_64

Grazie :slight_smile:

Tuttora non sei piu’ riuscito ad aggiornare la macchina, corretto?
Vediamo cosa vorrebbe installare, senza farglielo poi effettivamente fare:

# dnf update --assumeno

Poi cercheremo di aggiornare tutti i pacchetti non-correlati a dnf utilizzando dnf, e aggiorneremo a mano dnf tramite rpm (che e’ quello che usa dnf sotto per installare gli archivi RPM che scarica).

Grazie per la risposta bebo.

Purtroppo la situazione nel frattempo è precipitata:

  • prima fase: al primo aggiornamento che conteneva un nuovo kernel, la macchina ha smesso di funzionare (dopo la scelta del kernel, schermo nero e nessuna reazione della tastiera),
  • scegliendo il kernel precedente la macchina funzionava, e speravo che il kernel successivo avrebbe riportato la macchina ad uno stato accettabile, invece
  • seconda fase: ad un certo punto la macchina ha cominciato a non mostrare nemmeno più il GRUB, e quindi non potevo neanche scegliere il kernel. Ho avuto anche problemi a vedere il setup della scheda madre.

Dopo diversi tentativi (aggiornamento del firmware della scheda madre, creazione di una F30 live su pennetta, da cui non riusciva comunque a fare boot con il sistema normale) sono riuscito a bootare la live scegliendola direttamente dal setup della scheda madre, che consente di evitare il boot order, che non andava. Con questo almeno sono riuscito a fare un rsync della home. Poco, ma importante.

Il sistema ad un certo punto mi diceva di non riuscire a trovare nemmeno un supporto da cui fare boot, prima di riuscire a farlo con il trucco di selezionare la pennetta direttamente dal setup della scheda madre (meno male che c’è la opzione. La scheda è una Sabertooth 990FX-R2)

Adesso la mia ultima chance prima di dover riformattare tutto sarebbe di riuscire a capire cosa c’è che non va nel sistema partendo dalla live, credo. Ma non so da dove cominciare, confesso.

Immagino che sia andato a quel paese il GRUB, oltre al kernel più recente.

Per ora mi sto arrangiando con il laptop, ma avrei bisogno di trovare una soluzione.

Ciao e grazie!

Cioe’ dopo il logo/immagine iniziale non ti compare assolutamente niente? Schermo nero? o ti dice che “non trova il disco” o “non trova la partizione di boot”, o qualcosa di simile?

Casomai proviamo a reinstallare grub.

Esatto. In realtà non compare neanche l’immagine della scheda madre, però grazie al cielo riesco a entrare nel setup con F2, e da li a lanciare la live.
In alcuni casi mi ha dato il messaggio che non riusciva a trovare nessun supporto di boot, anche quando la pennetta era inserita e il boot loader aveva quella come prima scelta di boot. Non mi chiedere come mai.

Si a naso mi sembra che partire da reinstallare grub abbia senso. Quello dovrebbe poi usare i kernel che sono già sul sistema, corretto? Perchè almeno uno che funziona lo dovrei avere.

Ma il “logo” mancante si vedeva prima di questo crash?

Iniziamo poi a raccogliere un po’ di informazioni, dalla live:

[code]# fdisk -l

parted -l

blkid

efibootmgr -v[/code]

Una volta controllati questi valori, entreremo in un chroot e verificheremo lo stato dei pacchetti di grub e efi, e infine riconfigureremo grub.

(sto seguendo quanto suggerito da arkanoid qua, giusto per ricordarmi https://forum.fedoraonline.it/viewtopic.php?pid=244113#p244113 )

Quasi sempre. Capitava che lo saltasse, ma era abbastanza raro.

Ecco:
#1

[root@localhost-live ~]# fdisk -l
Disk /dev/sda: 465.8 GiB, 500107862016 bytes, 976773168 sectors
Disk model: Samsung SSD 840 
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: B07BFC85-C7AA-4613-B686-41127F2B1252

Device       Start       End   Sectors   Size Type
/dev/sda1     2048    976895    974848   476M EFI System
/dev/sda2   976896   2928639   1951744   953M Linux filesystem
/dev/sda3  2928640 976769023 973840384 464.4G Linux filesystem


Disk /dev/sdb: 3.7 TiB, 4000787030016 bytes, 7814037168 sectors
Disk model: Hitachi HDS72404
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: gpt
Disk identifier: 8A18345F-0873-4C5D-BDF2-CF6ED22796D2

Device     Start        End    Sectors  Size Type
/dev/sdb1   2048 7814035455 7814033408  3.7T Linux filesystem


Disk /dev/sdc: 3.7 TiB, 4000787030016 bytes, 7814037168 sectors
Disk model: Hitachi HDS72404
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: gpt
Disk identifier: 5D16ADFF-A28D-410F-A5F8-4D5F50B19FF4

Device     Start        End    Sectors  Size Type
/dev/sdc1   2048 7814035455 7814033408  3.7T Linux filesystem




Disk /dev/sdd: 7.5 GiB, 8029470208 bytes, 15682559 sectors
Disk model: Cruzer          
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0x4985011e

Device     Boot Start     End Sectors  Size Id Type
/dev/sdd1  *        0 3691935 3691936  1.8G  0 Empty
/dev/sdd2         172   20119   19948  9.8M ef EFI (FAT-12/16/32)
/dev/sdd3       20120   62103   41984 20.5M  0 Empty


Disk /dev/loop0: 1.7 GiB, 1788923904 bytes, 3493992 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


Disk /dev/loop1: 6.4 GiB, 6817841152 bytes, 13316096 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


Disk /dev/loop2: 32 GiB, 34359738368 bytes, 67108864 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


Disk /dev/mapper/live-rw: 6.4 GiB, 6817841152 bytes, 13316096 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


Disk /dev/mapper/live-base: 6.4 GiB, 6817841152 bytes, 13316096 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
[root@localhost-live ~]# 

poi:
#2

[root@localhost-live ~]# parted -l
Model: ATA Samsung SSD 840 (scsi)
Disk /dev/sda: 500GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt
Disk Flags: 

Number  Start   End     Size   File system  Name                  Flags
 1      1049kB  500MB   499MB  fat16        EFI System Partition  boot, esp
 2      500MB   1499MB  999MB  ext4
 3      1499MB  500GB   499GB  ext4


Model: ATA Hitachi HDS72404 (scsi)
Disk /dev/sdb: 4001GB
Sector size (logical/physical): 512B/4096B
Partition Table: gpt
Disk Flags: 

Number  Start   End     Size    File system  Name  Flags
 1      1049kB  4001GB  4001GB  btrfs


Model: ATA Hitachi HDS72404 (scsi)
Disk /dev/sdc: 4001GB
Sector size (logical/physical): 512B/4096B
Partition Table: gpt
Disk Flags: 

Number  Start   End     Size    File system  Name  Flags
 1      1049kB  4001GB  4001GB  btrfs


Model: SanDisk Cruzer (scsi)
Disk /dev/sdd: 8029MB
Sector size (logical/physical): 512B/512B
Partition Table: msdos
Disk Flags: 

Number  Start   End     Size    Type     File system  Flags
 2      88.1kB  10.3MB  10.2MB  primary  fat16        esp


Warning: Unable to open /dev/sr1 read-write (Read-only file system).  /dev/sr1
has been opened read-only.
Error: /dev/sr1: unrecognised disk label
Model: Unknown (unknown)                                                  
Disk /dev/sr1: 25.2MB
Sector size (logical/physical): 2048B/2048B
Partition Table: unknown
Disk Flags: 

[root@localhost-live ~]# 

indi:
#3

[root@localhost-live ~]# blkid
/dev/sdd1: UUID="2019-04-26-02-16-46-00" LABEL="Fedora-KDE-Live-30-1-2" TYPE="iso9660" PTUUID="4985011e" PTTYPE="dos" PARTUUID="4985011e-01"
/dev/sda1: SEC_TYPE="msdos" LABEL_FATBOOT="boot-efi" LABEL="boot-efi" UUID="8346-825C" TYPE="vfat" PARTLABEL="EFI System Partition" PARTUUID="f5b42f40-91f9-40ba-9b16-1eefd598f85a"
/dev/sda2: LABEL="boot" UUID="a5a7201c-b4a0-4bf3-a630-969d639a67df" TYPE="ext4" PARTUUID="9708bc4e-b954-40e9-a5af-e520b37b7a8c"
/dev/sda3: LABEL="root" UUID="9c2e31ca-9455-4337-b054-4b7d86086081" TYPE="ext4" PARTUUID="42d59b53-eda8-43f9-aa5e-72ad6d08c9cc"
/dev/sdb1: LABEL="giampaolo-ws" UUID="1690e979-2773-4cbe-af41-e028f89b969c" UUID_SUB="292c5537-56a2-4909-81a5-d4062d8bef1d" TYPE="btrfs" PARTUUID="becbe8b5-f00b-46e7-b481-495e2b243d59"
/dev/sdc1: LABEL="giampaolo-ws" UUID="1690e979-2773-4cbe-af41-e028f89b969c" UUID_SUB="37d22457-00ef-490b-89c6-bceff2fdeda0" TYPE="btrfs" PARTUUID="3df06bfe-c554-4096-b312-f5c119634a65"
/dev/sr1: UUID="2008-05-06-12-26-42-" LABEL="U3 System" TYPE="iso9660"
/dev/sdd2: SEC_TYPE="msdos" LABEL_FATBOOT="ANACONDA" LABEL="ANACONDA" UUID="A017-9B2F" TYPE="vfat" PARTUUID="4985011e-02"
/dev/sdd3: UUID="e114322d-8bf1-32e2-b5a1-e0473f3122d3" LABEL="ANACONDA" TYPE="hfsplus" PARTUUID="4985011e-03"
/dev/loop0: TYPE="squashfs"
/dev/loop1: LABEL="Anaconda" UUID="e7d44174-86fb-4f96-b5eb-d2f82e280b10" TYPE="ext4"
/dev/mapper/live-rw: LABEL="Anaconda" UUID="e7d44174-86fb-4f96-b5eb-d2f82e280b10" TYPE="ext4"
/dev/mapper/live-base: LABEL="Anaconda" UUID="e7d44174-86fb-4f96-b5eb-d2f82e280b10" TYPE="ext4"
/dev/pktcdvd/pktcdvd1: UUID="2008-05-06-12-26-42-" LABEL="U3 System" TYPE="iso9660"
[root@localhost-live ~]#

infine:
#4

[root@localhost-live ~]# efibootmgr -v
EFI variables are not supported on this system.
[root@localhost-live ~]#

[quote=bebo_sudo]
Una volta controllati questi valori, entreremo in un chroot e verificheremo lo stato dei pacchetti di grub e efi, e infine riconfigureremo grub.

(sto seguendo quanto suggerito da arkanoid qua, giusto per ricordarmi https://forum.fedoraonline.it/viewtopic.php?pid=244113#p244113 )[/quote]
Grazie. A prima vista non mi sembrava di capirci molto, ma lo guardo meglio.

Post scriptum
Una cosa che non ho capito è questa:
http://static.kjuicer.com/G/tmp/photo_2019-08-26_08-10-48.jpg
Edit: http://static.kjuicer.com/G/tmp/photo_2019-08-26_08-10-48.jpg perchè non la mostra sempre (dalla live si ma dal laptop no).
Cosa ci fa un boot Anaconda là in mezzo? Passi che siano tutti doppi (anche il fatto che ci siano versione Uefi, e non Uefi, un pochino mi lascia perplesso), ma è possibile che Anaconda, che poi è una Ide che uso per i virtual environment e in passato per sviluppare su Python, abbia installato un suo boot loader?

(Anche il SEC_TYPE=“msdos” sulla SSD mi sembra strano. Questa macchina non ha mai visto Windows.)

Potrebbero esserci questi problemi perchè il disco rigido sta morendo…

Il? Ce ne sono tre. La probabilità che tutti e tre stiano andando direi che è nulla. Due sono in raid, e uno funziona da cache, quindi tutti e tre dovrebbero permettere il boot. Non sono certo un esperto, ma non mi torna.

Ricordati che in una configurazione di dischi RAID il medesimo dato è memorizzato parte in un disco, parte in un altro, più un eventuale altro dato di controllo in un terzo. Poi c’è anche quale tipo di RAID: 0, 1, 2, 3, più loro combinazioni… Certo siamo più sicuri, ma cosa succede se uno qualunque dei dischi che possiedi non funziona poi tanto bene? Il fatto che non ti abbia mostrato GRUB è un brutto segno… Mi ricorda una cosa che mi è successa poco tempo fà: sul mio computer avevo un disco rigido con su installato Windows XP, ma non era collegato con i connettori SATA alla piastra madre. Decido di riavviarlo perchè c’erano dei dati che mi servivano. Riattacco il tutto e mi mostra all’avvio il messaggio “Invalid partition table”. Uso di CD di Windows per risolvere il problema, ma niente. Mi procuro un CD con dei programmi specifici e… niente. Il disco rigido era morto, da buttare. Ritorniamo a noi. Bisognerebbe verificare lo stato di salute di quei dischi e se ci sono problemi sostituirli.

Che sappia io i miei dischi sono configurati a mirror, non come dici tu. Non ho fatto io la configurazione, ma Frafra e qualche anno fa, ma mi risulta così.
Comunque possiamo controllare anche lo stato dei dischi.

Vediamo subito anche che dicono i valori SMART dei dischi:

# smartctl -a /dev/sdX

dove X e’ la lettera dei vari dischi di interesse (a, b, c).

I due dischi in mirror sono lo stesso modello, se fossero dello stesso batch/lotto di produzione potrebbe essere MOLTO facile che si siano rotti entrambi contemporaneamente.

Anaconda e’ anche il nome dell’installer di fedora, non riguarda il package manager di python.

Quel msdos dubito c’entri con windows, penso si riferisca al tipo di tabella di partizioni usato: https://unix.stackexchange.com/questions/289389/what-are-the-differences-between-the-various-partition-tables

Non capisco invece perche’ il tuo boot parli di UEFI OS, se efibootmgr non vede partizioni. Vediamo:

[code]# ls -l /boot/grub2/grub.cfg /boot/efi/EFI/fedora/grub.cfg

ls -l /sys/firmware/efi/[/code]

Potrebbe darsi che si sia “shvampata” (cit.) la partizione contenente le istruzioni per i vari EFI/UEFI.

Eccoci:
sda

[root@localhost-live ~]# smartctl -a /dev/sda
smartctl 7.0 2019-03-31 r4903 [x86_64-linux-5.0.9-301.fc30.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Samsung based SSDs
Device Model:     Samsung SSD 840 Series
Serial Number:    S14LNEACC19464E
LU WWN Device Id: 5 002538 55010a388
Firmware Version: DXT08B0Q
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon Aug 26 19:09:25 2019 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (53956) seconds.
Offline data collection
capabilities:                    (0x53) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  70) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       16785
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       2859
177 Wear_Leveling_Count     0x0013   098   098   000    Pre-fail  Always       -       24
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0
187 Uncorrectable_Error_Cnt 0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   073   045   000    Old_age   Always       -       27
195 ECC_Error_Rate          0x001a   200   200   000    Old_age   Always       -       0
199 CRC_Error_Count         0x003e   100   100   000    Old_age   Always       -       0
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -       59
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       14179802130

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
  255        0    65535  Read_scanning was never started
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[root@localhost-live ~]# 

sdb

[root@localhost-live ~]# smartctl -a /dev/sdb
smartctl 7.0 2019-03-31 r4903 [x86_64-linux-5.0.9-301.fc30.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Deskstar 7K4000
Device Model:     Hitachi HDS724040ALE640
Serial Number:    PK1361PAGYZRGV
LU WWN Device Id: 5 000cca 22bcda219
Firmware Version: MJAOA3B0
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon Aug 26 19:12:24 2019 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (   24) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 575) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   136   136   054    Pre-fail  Offline      -       81
  3 Spin_Up_Time            0x0007   124   124   024    Pre-fail  Always       -       616 (Average 625)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       2859
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   117   117   020    Pre-fail  Offline      -       36
  9 Power_On_Hours          0x0012   098   098   000    Old_age   Always       -       18220
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       2859
192 Power-Off_Retract_Count 0x0032   098   098   000    Old_age   Always       -       3281
193 Load_Cycle_Count        0x0012   098   098   000    Old_age   Always       -       3281
194 Temperature_Celsius     0x0002   181   181   000    Old_age   Always       -       33 (Min/Max 17/64)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1327         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[root@localhost-live ~]# 

sdc

[root@localhost-live ~]# smartctl -a /dev/sdc
smartctl 7.0 2019-03-31 r4903 [x86_64-linux-5.0.9-301.fc30.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Deskstar 7K4000
Device Model:     Hitachi HDS724040ALE640
Serial Number:    PK1361PAGY2KUV
LU WWN Device Id: 5 000cca 22bcd386d
Firmware Version: MJAOA3B0
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon Aug 26 19:14:02 2019 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (   24) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 568) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   136   136   054    Pre-fail  Offline      -       81
  3 Spin_Up_Time            0x0007   119   119   024    Pre-fail  Always       -       644 (Average 651)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       2859
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   117   117   020    Pre-fail  Offline      -       36
  9 Power_On_Hours          0x0012   098   098   000    Old_age   Always       -       18220
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       2859
192 Power-Off_Retract_Count 0x0032   098   098   000    Old_age   Always       -       3273
193 Load_Cycle_Count        0x0012   098   098   000    Old_age   Always       -       3273
194 Temperature_Celsius     0x0002   171   171   000    Old_age   Always       -       35 (Min/Max 17/67)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1327         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[root@localhost-live ~]#

e infine:

[root@localhost-live ~]# ls -l /boot/grub2/grub.cfg /boot/efi/EFI/fedora/grub.cfg
ls: cannot access '/boot/grub2/grub.cfg': No such file or directory
ls: cannot access '/boot/efi/EFI/fedora/grub.cfg': No such file or directory
[root@localhost-live ~]# ls -l /sys/firmware/efi/
total 0
-r--r--r--.  1 root root 4096 Aug 26 19:15 config_table
drwxr-xr-x.  2 root root    0 Aug 26 19:03 efivars
-r--r--r--.  1 root root 4096 Aug 26 19:15 fw_platform_size
-r--r--r--.  1 root root 4096 Aug 26 19:15 fw_vendor
-r--r--r--.  1 root root 4096 Aug 26 19:15 runtime
drwxr-xr-x. 14 root root    0 Aug 26 19:15 runtime-map
-r--------.  1 root root 4096 Aug 26 19:15 systab
[root@localhost-live ~]#

Le due directory boot grub2 ed EFI le vedo da Dolphin, ma non mi lascia accedere. Più logico che da root, nautalmente, ma almeno qualcosa compare.

Grazie mille, anche per le spiegazioni :slight_smile:

Secondo me, i dati mostrati dicono: i tre dischi rigidi sono messi male, molto male… Ci vorrebbe il giudizio di bebo_sudo per definire bene la questione. Non ho mai avuto dischi in modalità RAID, ma quando vedo queste linee dico tra di me: Troppi brutti segnali… In pratica sdb e sdc sono messi malissimo, sda è sulla via… Un consiglio: comprati tre dischi rigidi da 4 TB e incomincia a sostituirli, sperando che il sistema RAID ricostruisca i dati persi…

Scusa @d68qdq8dq, in base a cosa stai dicendo che i dischi sono messi male?
SMART dice che lo stato e’ ok, ed i valori SMART piu’ rilevanti (5, 187, 188, 197, 198, non tutti presenti su ogni tipo di disco) sono tutti a zero.

@giampaolo
L’ultimo comando e’ un errore mio, e’ corretto che non trovi quei file, perche’ ti ho dato un comando che viene eseguito nella live, e non dentro alla tua installazione.

Serve un’ultima informazione per poter poi entrare a lavorare dentro il sistema installato, cioe’ ci serve pescare il nome del raid mirror; immagino sia un software raid gestito da linux.
Vediamo da live:

# cat /proc/mdstat

[quote=bebo_sudo]
SMART dice che lo stato e’ ok, ed i valori SMART piu’ rilevanti (5, 187, 188, 197, 198, non tutti presenti su ogni tipo di disco) sono tutti a zero.[/quote]
Wheew, cara grazia!

:slight_smile:

Quello non lo so, provo a vedere se Frafra si ricorda cosa ha usato, ma di sicuro è qualcosa open source, se lo conosco.

[quote=bebo_sudo]
Vediamo da live:

# cat /proc/mdstat

Mi dice:

# cat /proc/mdstat cat: /proc: Is a directory cat: /mdstat: No such file or directory

Edit: Sto chattando con Frafra e non mi sembra che si ricordi cosa ha usato. Pero’ ho controllato la Mobo e non e’ un Raid hardware. La SSD che fa da cache e’ un ext4, mentre i due dischi normali sono btrfs.

Hai provato a dare un

# fsck -f /dev/sda1

per verificare lo stato della partizione EFI?
Non so se Linux sia, eventualmente, in grado di correggere una FAT, o se serva un DVD di Windows per dare un chksdk, ma almeno verifichi con fsck se la partizione EFI è corrotta (una volta non facevo più il boot per quello).

Mi sa che hai digitato uno spazio di mezzo tra /proc e /mdstat.

$ cat /proc /mdstat cat: /proc: Is a directory cat: /mdstat: No such file or directory

Dovrebbe scrivere quali raid sono disponibili:

$ cat /proc/mdstat Personalities : unused devices: <none>
(questo e’ vuoto, perche’ sulla mia macchina non ho niente)

Questo invece e’ dove c’e’ un raid:

[code]Personalities : [raid1] [raid6] [raid5] [raid4]
md_d0 : active raid5 sde1[0] sdf1[4] sdb1[5] sdd1[2] sdc1[1]
1250241792 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]
bitmap: 0/10 pages [0KB], 16384KB chunk

unused devices: [/code]
da https://raid.wiki.kernel.org/index.php/Mdstat