[Risolto] HD danneggiato e strategie di backup

Buongiorno,
prima o poi deve succedere, ieri in mia assenza il mio vecchio e glorioso HD ha chiesto il pensionamento (dal 2011 lavora 12 ore al giorno). Non mi è mai successo prima dunque vi chiedo alcune indicazioni. Scrivo dal portatile ed è difficile accludere immagini e stringhe.
I test all’avvio (HP) mi danno “connection test:failed” con codice “BIOHD1”: sul sito invitano a rivedere proprio i collegamenti, ma non credo sia un problema del genere, bensì proprio del disco. Avete qualche altra idea per testarlo e deliberare definitivamente che è irrecuperabile?
Per fortuna riesco ad accedere con una live al contenuto della home. Ho già backup incrementali delle cose di lavoro, ma vorrei fare un backup fresco di tutta la home su un disco esterno, in modo da ricostruirla sul nuovo computer che immagino mi toccherà comprare (già che ci sono passo a 64bit e prendo una macchina più potente, vi chiederò consigli sulle specifiche e su cose fedora-friendly in un post separato). Qual è la via più veloce per fare un backup dalla live? Ieri ho copiato un file dalla home a una chiavetta e ci ho messo 10 minuti…
Grazie a tutti e tutte!

Non la prendere come bibbia ma in genere si suggerisce di creare un’immagine del disco problematico con dd e sucessivamente dall’immagine estrarre i dati.

# dd if=device_del_disco_guasto of=device_di_un_disco_usb/nome.iso

nell’esempio ho messo un disco USB (che dovrà essere almeno della stessa capienza del disco guasto) perché dubito che sull’HD tu abbia talmente pochi dati per cui sia sufficiente un DVD.

P.S. ovviamente creare l’immagine utilizzando una live per avviare il PC.

Grazie mille,
in tanti anni è la prima volta che mi capita e per questo mi rivolgo ai fratelli fedoriani, ho fiducia cieca in questo forum!
Dunque creo l’immagine da live con il comando, scrivendola ovviamente su un hd esterno (magari bastasse un misero dvd…).
In effetti volevo fare solo il backup della home, ma essendo la partizione di gran lunga più ampia (e piena) posso fare l’immagine del disco e non cambia molto.
Non mi è chiarissimo come “estrarre” poi la home da un’immagine ma mi documento.
Buona giornata, viva Fedora!

Per ben due volte mi è successo di trovarmi con un HD rotto e sono riuscito in tutti e due i casi a recuperare il sistema completo copiandolo su un HD con le stesse dimensioni dell’originale usando il comando mostrato nel post #2. Con un HD da 500 Gb ci vogliono circa 7 ore. Poi ci vogliono sul sistema copiato 2 riavvi effettuati in automatico per eseguire i controlli di sicurezza e integrare le parti mancanti nel FS.

Grazie!
Anche quest’ultima sarebbe un’opzione interessante, ma credo che tenterò la creazione dell’immagine della sola home. Poi nella nuova macchina farò un’installazione “pulita” della 27 e aggiungerò subito dopo la home da immagine. Infine rimuoverò quasi tutti i settaggi e dati vecchi eliminando gran parte delle cartelle nascoste .*
Comincio…

…male!

[root@localhost-live /]# dd if=/dev/sda4 of=dev/sdd/oldhome.iso dd: failed to open 'dev/sdd/oldhome.iso': Not a directory

pensavo si automontasse, ma forse la live ha bisogno di un aiuto, ho pensato di montarlo allora

[code][root@localhost-live /]# mount /dev/sdd discohome/
mount: wrong fs type, bad option, bad superblock on /dev/sdd,
missing codepage or helper program, or other error

   In some cases useful info is found in syslog - try
   dmesg | tail or so[/code]

che succede?

1171.924372] usb 2-1.5: new high-speed USB device number 5 using ehci-pci 1172.005253] usb 2-1.5: New USB device found, idVendor=0480, idProduct=a202 1172.005256] usb 2-1.5: New USB device strings: Mfr=1, Product=2, SerialNumber=3 1172.005258] usb 2-1.5: Product: External USB 3.0 1172.005259] usb 2-1.5: Manufacturer: TOSHIBA 1172.005261] usb 2-1.5: SerialNumber: 20171003005389F 1172.006152] usb-storage 2-1.5:1.0: USB Mass Storage device detected 1172.007874] scsi host8: usb-storage 2-1.5:1.0 1175.693443] scsi 8:0:0:0: Direct-Access TOSHIBA External USB 3.0 5438 PQ: 0 ANSI: 6 1175.694047] sd 8:0:0:0: Attached scsi generic sg4 type 0 1175.695639] sd 8:0:0:0: [sdd] 1953525164 512-byte logical blocks: (1.00 TB/932 GiB) 1175.696533] sd 8:0:0:0: [sdd] Write Protect is off 1175.696536] sd 8:0:0:0: [sdd] Mode Sense: 23 00 00 00 1175.697398] sd 8:0:0:0: [sdd] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA 1175.737162] sdd: sdd1 1175.741393] sd 8:0:0:0: [sdd] Attached SCSI disk 1274.152536] EXT4-fs (sda4): mounted filesystem with ordered data mode. Opts: (null) 1988.158503] capability: warning: `gvfsd-admin' uses 32-bit capabilities (legacy support in use)

sembrerebbe a posto ma lo vede e non lo monta, nemmeno su altra directory

[code][root@localhost-live /]# mount /dev/sdd /mnt/esterno
mount: wrong fs type, bad option, bad superblock on /dev/sdd,
missing codepage or helper program, or other error

   In some cases useful info is found in syslog - try
   dmesg | tail or so.

[/code]

mi perdo in un bicchiere d’acqua?

Decisamente!
Non avevo aggiunto il magico numerino… con sdd1 invece di sdd monta l’hd esterno.
Ma a 100 mega al minuto finisce in una settimana! Ha senso?

Un disco da 1 TB? Facciamo minimo 14 ore…

Una partizione da 600G, nemmeno pienissima, ma qui c’è qualcosa che non torna, in 3 ore ha prodotto solo 10G di iso, mi sa che la blocco e ci ragiono - settaggi di dd da inserire? Usb lente? Passaggio per la live problematico? Computer obsoleto? Disco danneggiato?

Se devi copiare un disco, anche danneggiato, con il comando dd devi imparare ad avere pazienza. Solo quando vedrai di nuovo comparire il cursore lampeggiante potrai dire: " Finalmente!".

Tutta la pazienza del mondo, se si parla di “ore”. Ma ho calcolato che avrei dovuto lasciare acceso il computer con la live per almeno 3 giorni di fila! E magari alla fine vien fuori un messaggio di errore o si blocca…
Non ci sono alternative? Ho visto dei settaggi “velocizzanti” (vedi ad es, la https://askubuntu.com/questions/523037/how-would-i-speed-up-a-full-disk-dd fra cugini), anche se credo che il problema sia la velocità delle porte (2011…) e il fatto che opero da una live (essa stessa da usb)

Sconsiglio l’uso di dd su hard drive malfunzionanti, meglio utilizzare ddrescue che è pensato appositamente per questo caso. Comunque sia, la copia può richiedere molto più tempo. La live non rallenta, i colli di bottiglia sono le operazioni di lettura dal disco danneggiato e di scrittura sulla seconda periferica.

Grazie frafra,
per le precisazioni e per il suggerimento: lo proverò senz’altro.
Mi sorge però un dubbio: come faccio ad “installarlo” da una live? Ho provato con altri pacchetti via dnf ma non me lo consente…

Di nulla.

Nella live puoi aggiornare/installare un numero limitato di pacchetti. Prova con:

# dnf install ddrescue

Se non va, riavvia e prova a disabilitare il repository degli aggiornamenti prima di riprovare.

Al momento ho installato ddrescue e ho lanciato la copia della partizione della home (660G) sul disco esterno. Gira da dieci minuti, con un inquietante “remaining time” pari a minimo “11d”: la prospettiva di lasciare accesso il computer di qui a capodanno, se non oltre, mi atterrisce… vediamo se entro stasera le cose migliorano :white:

Ne dubito :slight_smile: l’unica è lasciarlo lavorare…

Questo mi deprime abbastanza…
Comunque ho fermato tutto, nella fretta (ci lavoro nei ritagli), avevo “dimenticato” di far la copia in immagine, magari la copia file-per-file incideva sulle disastrose previsioni di completamento a capodanno…
Da lunedì sono in feste-ferie due settimane e ci ripenso a mente sgombra e con più calma e possibilità di seguire il decorso.

Grazie di tutto a tutti!

EDIT aggiungo solo che mi è sorto un ultimo dubbio e sto testando l’hd con GSmartControl, cosa che forse avrei dovuto fare prima, ma ad un certo punto ho dato per scontato che fosse danneggiato

Aggiungo il report di GSmartControl, per quel che ci capisco il disco sembra davvero “andato”: dati i valori, le valutazioni (qui non riportate, ma nell’originale sezione “attributi”) sono sempre “old disk” o “pre-failure”… E il test “esteso” si è bloccato al 10%. Ho anche aperto il cassone per verificare che non fosse questione di cavo (staccati e riattaccati) con il medesimo esito (non fa il boot).

[code]smartctl 6.5 2016-05-07 r4318 [i686-linux-4.11.8-300.fc26.i686] (local build)
Copyright © 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.12
Device Model: ST3750528AS
Serial Number: 9VPCFZ1N
LU WWN Device Id: 5 000c50 035423b0d
Firmware Version: HP40
User Capacity: 750,156,374,016 bytes [750 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: 7200 rpm
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 2.6, 3.0 Gb/s
Local Time is: Wed Dec 20 04:48:00 2017 EST

==> WARNING: A firmware update for this drive may be available,
see the following Seagate web pages:
http://knowledge.seagate.com/articles/en_US/FAQ/207931en
http://knowledge.seagate.com/articles/en_US/FAQ/213891en

SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is: Unavailable
APM feature is: Unavailable
Rd look-ahead is: Enabled
Write cache is: Enabled
ATA Security is: Disabled, frozen [SEC2]

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 617) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 147) minutes.
SCT capabilities: (0x103b) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE
1 Raw_Read_Error_Rate POSR-K 108 099 006 - 130006435
3 Spin_Up_Time PO—K 095 095 000 - 0
4 Start_Stop_Count -O–CK 096 096 020 - 4960
5 Reallocated_Sector_Ct PO–CK 084 084 036 - 695
7 Seek_Error_Rate POSR-K 087 060 030 - 621469303
9 Power_On_Hours -O–CK 072 072 000 - 24678
10 Spin_Retry_Count PO–CK 100 100 097 - 0
12 Power_Cycle_Count -O–CK 098 098 020 - 2480
180 Unknown_HDD_Attribute PO-R-K 100 100 000 - 0
183 Runtime_Bad_Block -O–CK 100 100 000 - 0
184 End-to-End_Error PO–CK 100 100 097 - 0
187 Reported_Uncorrect -O–CK 099 099 000 - 1
188 Command_Timeout -O–CK 093 093 000 - 90196937083
189 High_Fly_Writes -O-RCK 100 100 000 - 0
190 Airflow_Temperature_Cel -O—K 067 058 045 - 33 (Min/Max 17/33)
194 Temperature_Celsius -O—K 033 042 000 - 33 (0 10 0 0 0)
195 Hardware_ECC_Recovered -O-RCK 044 035 000 - 130006435
196 Reallocated_Event_Count -O–CK 084 084 036 - 695
197 Current_Pending_Sector -O–CK 100 100 000 - 0
198 Offline_Uncorrectable ----CK 100 100 000 - 0
199 UDMA_CRC_Error_Count -O–CK 200 200 000 - 0
||||||_ K auto-keep
|||||__ C event count
||||___ R error rate
|||____ S speed/performance
||_____ O updated online
|______ P prefailure warning

General Purpose Log Directory Version 1
SMART Log Directory Version 1 [multi-sector log support]
Address Access R/W Size Description
0x00 GPL,SL R/O 1 Log Directory
0x01 GPL,SL R/O 1 Summary SMART error log
0x02 GPL,SL R/O 5 Comprehensive SMART error log
0x03 GPL R/O 5 Ext. Comprehensive SMART error log
0x06 GPL,SL R/O 1 SMART self-test log
0x07 GPL R/O 1 Extended self-test log
0x09 GPL,SL R/W 1 Selective self-test log
0x10 GPL R/O 1 SATA NCQ Queued Error log
0x11 GPL R/O 1 SATA Phy Event Counters log
0x21 GPL R/O 1 Write stream error log
0x22 GPL R/O 1 Read stream error log
0x80-0x9f GPL,SL R/W 16 Host vendor specific log
0xa1 GPL,SL VS 20 Device vendor specific log
0xa2 GPL VS 2248 Device vendor specific log
0xa8 GPL,SL VS 129 Device vendor specific log
0xa9 GPL,SL VS 1 Device vendor specific log
0xb0 GPL VS 2928 Device vendor specific log
0xbd GPL VS 252 Device vendor specific log
0xbe-0xbf GPL VS 65535 Device vendor specific log
0xe0 GPL,SL R/W 1 SCT Command/Status
0xe1 GPL,SL R/W 1 SCT Data Transfer

SMART Extended Comprehensive Error Log Version: 1 (5 sectors)
No Errors Logged

SMART Extended Self-test Log Version: 1 (1 sectors)
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error

1 Short offline Completed without error 00% 24360 -

2 Short offline Completed without error 00% 24296 -

3 Extended offline Interrupted (host reset) 90% 0 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

SCT Status Version: 3
SCT Version (vendor specific): 522 (0x020a)
SCT Support Level: 1
Device State: Active (0)
Current Temperature: 33 Celsius
Power Cycle Min/Max Temperature: 17/33 Celsius
Lifetime Min/Max Temperature: 10/42 Celsius
Under/Over Temperature Limit Count: 0/0

SCT Temperature History Version: 2
Temperature Sampling Period: 1 minute
Temperature Logging Interval: 59 minutes
Min/Max recommended Temperature: 14/55 Celsius
Min/Max Temperature Limit: 10/60 Celsius
Temperature History Size (Index): 128 (44)

Index Estimated Time Temperature Celsius
45 2017-12-14 23:11 17 -
46 2017-12-15 00:10 17 -
47 2017-12-15 01:09 30 ***********
48 2017-12-15 02:08 31 ************
49 2017-12-15 03:07 31 ************
50 2017-12-15 04:06 31 ************
51 2017-12-15 05:05 ? -
52 2017-12-15 06:04 17 -
53 2017-12-15 07:03 17 -
54 2017-12-15 08:02 30 ***********
55 2017-12-15 09:01 31 ************
… …( 2 skipped). … ************
58 2017-12-15 11:58 31 ************
59 2017-12-15 12:57 30 ***********
60 2017-12-15 13:56 30 ***********
61 2017-12-15 14:55 30 ***********
62 2017-12-15 15:54 31 ************
… …( 2 skipped). … ************
65 2017-12-15 18:51 31 ************
66 2017-12-15 19:50 32 *************
67 2017-12-15 20:49 31 ************
68 2017-12-15 21:48 30 ***********
69 2017-12-15 22:47 ? -
70 2017-12-15 23:46 17 -
71 2017-12-16 00:45 17 -
72 2017-12-16 01:44 31 ************
… …( 12 skipped). … ************
85 2017-12-16 14:31 31 ************
86 2017-12-16 15:30 30 ***********
87 2017-12-16 16:29 ? -
88 2017-12-16 17:28 17 -
89 2017-12-16 18:27 ? -
90 2017-12-16 19:26 19 -
91 2017-12-16 20:25 19 -
92 2017-12-16 21:24 31 ************
93 2017-12-16 22:23 31 ************
94 2017-12-16 23:22 30 ***********
… …( 2 skipped). … ***********
97 2017-12-17 02:19 30 ***********
98 2017-12-17 03:18 ? -
99 2017-12-17 04:17 16 -
100 2017-12-17 05:16 16 -
101 2017-12-17 06:15 30 ***********
102 2017-12-17 07:14 31 ************
… …( 3 skipped). … ************
106 2017-12-17 11:10 31 ************
107 2017-12-17 12:09 ? -
108 2017-12-17 13:08 17 -
109 2017-12-17 14:07 ? -
110 2017-12-17 15:06 20 *
111 2017-12-17 16:05 ? -
112 2017-12-17 17:04 20 *
113 2017-12-17 18:03 20 *
114 2017-12-17 19:02 30 ***********
115 2017-12-17 20:01 30 ***********
116 2017-12-17 21:00 31 ************
… …( 7 skipped). … ************
124 2017-12-18 04:52 31 ************
125 2017-12-18 05:51 33 **************
126 2017-12-18 06:50 ? -
127 2017-12-18 07:49 17 -
0 2017-12-18 08:48 17 -
1 2017-12-18 09:47 31 ************
2 2017-12-18 10:46 32 *************
3 2017-12-18 11:45 31 ************
4 2017-12-18 12:44 32 *************
5 2017-12-18 13:43 31 ************
… …( 3 skipped). … ************
9 2017-12-18 17:39 31 ************
10 2017-12-18 18:38 ? -
11 2017-12-18 19:37 17 -
12 2017-12-18 20:36 ? -
13 2017-12-18 21:35 32 *************
14 2017-12-18 22:34 ? -
15 2017-12-18 23:33 32 *************
16 2017-12-19 00:32 ? -
17 2017-12-19 01:31 32 *************
18 2017-12-19 02:30 ? -
19 2017-12-19 03:29 33 **************
20 2017-12-19 04:28 ? -
21 2017-12-19 05:27 18 -
22 2017-12-19 06:26 18 -
23 2017-12-19 07:25 35 ****************
24 2017-12-19 08:24 ? -
25 2017-12-19 09:23 17 -
26 2017-12-19 10:22 ? -
27 2017-12-19 11:21 18 -
28 2017-12-19 12:20 ? -
29 2017-12-19 13:19 17 -
30 2017-12-19 14:18 17 -
31 2017-12-19 15:17 35 ****************
32 2017-12-19 16:16 36 *****************
33 2017-12-19 17:15 35 ****************
34 2017-12-19 18:14 35 ****************
35 2017-12-19 19:13 35 ****************
36 2017-12-19 20:12 ? -
37 2017-12-19 21:11 17 -
38 2017-12-19 22:10 17 -
39 2017-12-19 23:09 ? -
40 2017-12-20 00:08 18 -
41 2017-12-20 01:07 18 -
42 2017-12-20 02:06 ? -
43 2017-12-20 03:05 17 -
44 2017-12-20 04:04 17 -

SCT Error Recovery Control:
Read: Disabled
Write: Disabled

Device Statistics (GP/SMART Log 0x04) not supported

SATA Phy Event Counters (GP Log 0x11)
ID Size Value Description
0x000a 2 8 Device-to-host register FISes sent due to a COMRESET
0x0001 2 0 Command failed due to ICRC error
0x0003 2 0 R_ERR response for device-to-host data FIS
0x0004 2 0 R_ERR response for host-to-device data FIS
0x0006 2 0 R_ERR response for device-to-host non-data FIS
0x0007 2 0 R_ERR response for host-to-device non-data FIS[/code]

Cari fedoriani,

nonostante mi fossi ripromesso di lasciare perdere per un po’, non ho resistito e ho lanciato un dd della partizione home su un hd esterno, operando da una live.

Stamattina dopo 3 giorni e 7 ore di lentissima attività (49 giga, il 7,5% della partizione da recuperare) qualcosa è andato storto e ddrescue mi comunicava “Error writing mapfile …]: Read-only file-system”. Riprovando (Enter) si riproduceva il problema, una “emergency saving” (E-Enter) era impossibile e dunque ho dovuto chiudere la pratica (Q-Enter).
Non mi permetteva neppure di salvare files né sulla chiave della live, né sul disco esterno, dunque non ho potuto copiare da terminale, giusto fotografare lo schermo a futura memoria.

Se avete suggerimenti sono i benvenuti.
Al momento la mia idea è comprare una nuova macchina, copiare sulla nuova home l’ultimo backup periodico delle cartelle più importanti (li faccio settimanalmente) e provare a montare la partizione della vecchia home da una live per copiare a mano su una chiave i singoli files più recenti (della settimana prima della crisi dell’hd). Quel che recupero bene, il resto pace.

Buone feste fedoriane

Read only file system? Dove stavi salvando il file?