Discussion:
SMART-Anzeige bei grosser externer 2"5-USB-Festplatte
(zu alt für eine Antwort)
Stefan Ram
2023-10-18 12:49:52 UTC
Permalink
Ich habe beim SMART-Wert "Current Pending Sector Count" einer
grossen externen 2"5-USB-Festplatte, die ich hier einmal "A" nenne,
einen Wert, der nicht 0 ist. Und zwar war dieser Wert vorgestern 9,
gestern 11, und heute ist er 3. "Reallocated Sector Count" hat keinen
Wert. Das ganze auf einer neuen Festplatte, die erst seit zirka
100 Tagen im Betrieb ist und seitdem nur mäßig beansprucht wurde.

Normalerweise schaue ich mir die SMART-Werte gar nicht an,
aber vorgestern tat ich dies, da mir Probleme auffielen, welche
Hardware-Störungen dieser Festplatte gewesen sein könnten.

Ich bin gerade dabei, die Daten von dieser Festplatte A auf eine
neue Festplatte B zu kopieren (zu "retten", umzuziehen).

Es gab in den letzten Tagen einen einmaligen Wackelkontakt
an einem USB-Stecker, ich frage mich, ob dadurch Probleme
verursacht worden sein könnten.

Nun überlege ich, ob ich Festplatte A jetzt wegwerfen oder
weiter diagnostizieren soll und welche Diagnose-Software
gegebenenfalls hilfreich wäre. Unter Windows gibt es ja eine
Prüfprogramm CHKDSK, das jeden einzelnen Sektor prüft.

Außerdem zeigt mir meine Software hier folgenden SMART-Wert an:

Current Pending Sector Count: 200/Always OK, Worst: 200 (Data = 3,0)

. Ich nehme an, daß "Data = 3,0" der gültige Wert ist, aber
was bedeutet eigentlich "200/Always OK, Worst: 200"?
Takvorian
2023-10-18 13:34:37 UTC
Permalink
Post by Stefan Ram
Ich habe beim SMART-Wert "Current Pending Sector Count" einer
grossen externen 2"5-USB-Festplatte, die ich hier einmal "A" nenne,
einen Wert, der nicht 0 ist. Und zwar war dieser Wert vorgestern 9,
gestern 11, und heute ist er 3.
Das ist die Zahl der schwachen Sektoren die zur Verschiebung vorgemerkt
sind. Der Wert kann also auf Null sinken wenn die Operation abgeschlossen
ist.
Handlungsempfehlung: Für unternehmenskritische Anwendungen die Festplatte
bereits beim 1. defekten Sektor vorsichtshalber ersetzen.
Post by Stefan Ram
Es gab in den letzten Tagen einen einmaligen Wackelkontakt
an einem USB-Stecker, ich frage mich, ob dadurch Probleme
verursacht worden sein könnten.
IMHO eher nicht.
Post by Stefan Ram
Nun überlege ich, ob ich Festplatte A jetzt wegwerfen oder
weiter diagnostizieren soll und welche Diagnose-Software
gegebenenfalls hilfreich wäre. Unter Windows gibt es ja eine
Prüfprogramm CHKDSK, das jeden einzelnen Sektor prüft.
CHKDSK.exe /F /R könnte nicht schaden.
Post by Stefan Ram
Current Pending Sector Count: 200/Always OK, Worst: 200 (Data = 3,0)
. Ich nehme an, daß "Data = 3,0" der gültige Wert ist, aber was bedeutet
eigentlich "200/Always OK, Worst: 200"?
https://www.computerwissen.de/software/tools/festplattentools/smart-parameter-im-ueberblick/
https://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
Marco Moock
2023-10-19 06:39:33 UTC
Permalink
Post by Stefan Ram
Nun überlege ich, ob ich Festplatte A jetzt wegwerfen oder
weiter diagnostizieren soll und welche Diagnose-Software
gegebenenfalls hilfreich wäre. Unter Windows gibt es ja eine
Prüfprogramm CHKDSK, das jeden einzelnen Sektor prüft.
Nimm NACH der Rettungsaktion unter Linux badblocks und lasse alle
Blöcke lesen und schreiben.
Hier darf kein Fehler auftreten.
Marcel Mueller
2023-10-19 09:34:50 UTC
Permalink
Post by Stefan Ram
Ich habe beim SMART-Wert "Current Pending Sector Count" einer
grossen externen 2"5-USB-Festplatte, die ich hier einmal "A" nenne,
einen Wert, der nicht 0 ist. Und zwar war dieser Wert vorgestern 9,
gestern 11, und heute ist er 3. "Reallocated Sector Count" hat keinen
Wert. Das ganze auf einer neuen Festplatte, die erst seit zirka
100 Tagen im Betrieb ist und seitdem nur mäßig beansprucht wurde.
Das sind Datenverluste, also Sektoren deren Inhalt die Platte nicht mehr
lesen kann. Wenn ein solcher Sektor wieder mit neuen Daten
/überschrieben/ wird, ist er i.d.R. wieder lesbar, aber die alten sind
definitiv weg. Deshalb kann die Zahl auch kleiner werden.

Das muss kein technischer Defekt sein. Datenverluste in kleinen Mengen
sind im besonderen in der Consumer-Class spezifikationsgemäß. Sie werden
schlicht zufällig z.B. durch das Kippen magnetischer Domänen durch
Tunneleffekt ausgelöst. Und wenn zu viele in einem Sektor gekippt sind,
dann packt es die Fehlerkorrektur nicht mehr.
Nur wenn ein Sektor reproduzierbar Probleme macht, würde die Firmware
einen Mediendefekt vermuten und einen Reservesektor aktivieren.

Wenn solche Verluste häufiger werden, deutet das i.d.R. auf technische
Probleme hin. Entweder sind dann die Schreib-/Leseköpfe degradiert oder
die Lager defekt und dadurch die Drehzahl etwas instabil.
Post by Stefan Ram
Ich bin gerade dabei, die Daten von dieser Festplatte A auf eine
neue Festplatte B zu kopieren (zu "retten", umzuziehen).
Weise Idee.
Post by Stefan Ram
Es gab in den letzten Tagen einen einmaligen Wackelkontakt
an einem USB-Stecker, ich frage mich, ob dadurch Probleme
verursacht worden sein könnten.
So etwas /kann/ passieren, vor allem bei USB3-Platten ohne externes
Netzteil. Szenario ist dann, dass der Strom ausfällt. Dadurch kann der
Sektor, den die Platte gerade im Begriff zu schreiben ist, nicht
vollständig geschrieben werden und ist danach unlesbar. Eine größere
Anzahl bekommt man auf die Tour aber normalerweise nicht hin. Und
normalerweise geben sich die Firmwares auch etwas Mühe, bei noch
tolerablem Spannungsabfall sofort alle Schreibzugriffe zu unterbinden.
Post by Stefan Ram
Nun überlege ich, ob ich Festplatte A jetzt wegwerfen oder
weiter diagnostizieren soll und welche Diagnose-Software
gegebenenfalls hilfreich wäre. Unter Windows gibt es ja eine
Prüfprogramm CHKDSK, das jeden einzelnen Sektor prüft.
Das ist nur bedingt zielführend. Man kann es allerdings zum Scrubbing
verwenden, da es alle Sektoren einer Partition einmal liest. Das
schließt allerdings auch aktuell unbenutzte Sektoren ein, bei denen der
Fehler beim nächsten Schreiben automatisch behoben wäre.

Das kopieren aller Daten ist daher i.A. die bessere Idee. Da merkt man
dann schon, was wirklich nicht mehr lesbar ist. Allerdings sollte man
ein Kopierprogramm nehmen, was nicht gleich beim erstbesten Fehler
abbricht, sondern lieber ein Fehlerprotokoll schreibt. Ich glaube mit
Windows ROBOCOPY geht das auch irgendwie.

Um die Platte wirklich komplett zu testen, sollte man den eingebauten
SMART-Selbsttest in der "long"-Variante starten. Der läuft technisch
sogar im Hintergrund ab, kann aber z.T. etliche Stunden dauern. Die
SMART Daten zeigen an, wie weit er ist.
Post by Stefan Ram
Current Pending Sector Count: 200/Always OK, Worst: 200 (Data = 3,0)
. Ich nehme an, daß "Data = 3,0" der gültige Wert ist, aber
was bedeutet eigentlich "200/Always OK, Worst: 200"?
Das ist die relative Einschätzung der Firmware zu diesem Wert. Sie
definiert die Skala von 0 bis 200, und laut Firmware ist der aktuelle
Zustand noch spezifikationsgemäß und ihr nicht einmal eine Abwertung auf
199/200 wert. Aus Sicht des Herstellers sind Datenverluste natürlich
viel besser als Servicefälle. ;-)
Da sich die Werte manchmal auch wieder verbessern können, speichert
"Worst" den niedrigsten bei diese Platte jemals erreichten Wert.
Üblicherweise gehört noch eine weitere Zahl "Threshold" dazu. Bei
Unterschreitung derselben sollte die Platte ausgemustert werden. Den hat
der Herstelle hier wohl sicherheitshalber auf 0 gesetzt ("Always OK").
Heißt, die Datenverluste sind nicht Teil der Zustandsbetrachtung. Bei
den Reservesektoren sieht das mutmaßlich anders aus. Aber die werden,
wie oben genannt nur sparsam eingesetzt, was inhaltlich auch meist
richtig ist, denn zufällige Fehler sind eben nicht im selben Sektor
reproduzierbar. Die sind einfach Auslegungssache.

Wenn man da was besseres haben will, muss man in den Datenblättern nach
"No recoverable error rate" o.ä. wühlen. Da steht dann sowas wie 1/1E14,
also 1 Bit pro 10^14 Bits nicht lesbar. Was das z.B. bei einer 12TB
Platte heißt, kann man sich selbst ausrechnen - 1-mal komplett lesen =>
ein Sektor weg!
Das ist natürlich eine obere Schranke. In der Praxis ist der Wert meist
deutlich besser. Genaueres hängt vom Nutzungsszenario ab, also unter
anderem dem durchschnittlichen Alter der Daten auf der Platte und allem
voran der Temperatur.

Wenn man da etwas besseres haben will, also 1/1E15, dann stellt man
schnell fest, dass nahezu alles aus der Consumer-Class raus fliegt und
sogar manches Entry-Server-Produkt. Ich nutze aus solchen Gründen
Seagate Ironwolf Pro für die externen Backups. Und weil ich der
Dauerhaltbarkeit vom Helium noch nicht recht traue, habe ich auch noch
die Modelle ohne Helium-Füllung.


Marcel

Lesen Sie weiter auf narkive:
Loading...