Discussion:
SMART Self-test bleibt hängen
(zu alt für eine Antwort)
Werner Holtfreter
2008-12-12 16:00:50 UTC
Permalink
Hallo,

ich starte den self-test öfters mit smartctl 5.39. Neuerdings
zeigt sich, dass die prognostizierte Zeit (1 min für "short",
92 min für "long") um ein mehrfaches überschritten wird.

Jetzt, bei einer frisch vom Herstellertausch kommenden Platte, wird
der self-test innerhalb eines Tages gar nicht mehr fertig:

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Aborted by host 80% 19 -
# 2 Short offline Aborted by host 70% 18 -
# 3 Extended offline Aborted by host 90% 17 -
# 4 Extended offline Aborted by host 90% 16 -
# 5 Extended offline Self-test routine in progress 90% 19 -

(Nr. 1 ist der jüngste Test. Nur der aktuell laufende Test
wird als höchste Nummer angezeigt und nach Beendigung zur
neuen Nr. 1 (schön ist anders)).

Es handelt sich um:

Model Family: Seagate Barracuda 7200.10 family
Device Model: ST3250620AS
Firmware Version: 3.AAE
User Capacity: 250.059.350.016 bytes

Das Fehlerbild irritiert mich. Einerseits sollte ein Selbsttest
unabhängig vom System sein (zumindest, wenn wie hier im
Desktop-Einsatz, nicht ständig Verkehr auf der Platte herrscht).
Andererseits ist es nun schon die 2 Platte, die hier an meinem
Rechner dieses Problem zeigt. SMART-log der Platte ist sonst
unauffällig. Was ist da los?
--
Gruß Werner
Bedingungsloses Grundeinkommen:
www.jungefreiheit.de/Single-News-Display.268+M57f5b5a1a83.0.html
Christian Franke
2008-12-12 19:53:12 UTC
Permalink
Post by Werner Holtfreter
ich starte den self-test öfters mit smartctl 5.39. Neuerdings
zeigt sich, dass die prognostizierte Zeit (1 min für "short",
92 min für "long") um ein mehrfaches überschritten wird.
Jetzt, bei einer frisch vom Herstellertausch kommenden Platte, wird
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Aborted by host 80% 19 -
# 2 Short offline Aborted by host 70% 18 -
# 3 Extended offline Aborted by host 90% 17 -
# 4 Extended offline Aborted by host 90% 16 -
# 5 Extended offline Self-test routine in progress 90% 19 -
"Aborted by host" bedeutet normalerweise, dass der Test per SMART
Kommando (smartctl -X /dev/ice) abgebrochen wurde.
Bei Abbruch durch Reboot steht dort meistens "Interrupted (host reset)".

Zwar ist es bei großen Platten manchmal tatsächlich so, dass ein
normaler Arbeitstag für einen "Extended" Test nicht mehr ausreicht, ein
"Short" Test sollte allerdings kein Problem sein.

Was steht als Status des letzten Tests in den SMART Daten ?
Die Angabe findet man im 'smartctl -c' oder -a Output als:

"Self-test execution status: (BYTE) TEXT ..."

Läuft ein sehr kurzer "Selective" Test durch ?
Z.B. nur die ersten 10 Sektoren: smartctl -t select,0-9 /dev/ice
Post by Werner Holtfreter
(Nr. 1 ist der jüngste Test. Nur der aktuell laufende Test
wird als höchste Nummer angezeigt und nach Beendigung zur
neuen Nr. 1 (schön ist anders)).
Für Verbesserungsvorschläge ist die Mailingliste
smartmontools-support at lists.sourceforge.net
auch ohne Subscription geöffnet :-)
Post by Werner Holtfreter
Model Family: Seagate Barracuda 7200.10 family
Device Model: ST3250620AS
Firmware Version: 3.AAE
User Capacity: 250.059.350.016 bytes
Das Fehlerbild irritiert mich. Einerseits sollte ein Selbsttest
unabhängig vom System sein (zumindest, wenn wie hier im
Desktop-Einsatz, nicht ständig Verkehr auf der Platte herrscht).
Andererseits ist es nun schon die 2 Platte, die hier an meinem
Rechner dieses Problem zeigt. SMART-log der Platte ist sonst
unauffällig. Was ist da los?
Ist es die 2. Platte desselben Typs ?
Zeigt der gleiche Plattentyp an einem anderen System ein anderes Verhalten ?

Gruß
Christian
Werner Holtfreter
2008-12-13 01:57:21 UTC
Permalink
Post by Christian Franke
"Aborted by host" bedeutet normalerweise, dass der Test per SMART
Kommando (smartctl -X /dev/ice) abgebrochen wurde.
Bei Abbruch durch Reboot steht dort meistens "Interrupted (host reset)".
Gerade noch mal getestet: Hier erscheint bei Reboot und
bei "smartctl -X" immer "Aborted by host", bei zwei getesteten
Platten!

Ein "Interrupted (host reset)" wird gemeldet, wenn ich der Platte
die Stromversorgung abschalte (mit Wechselrahmen-Schalter).
Post by Christian Franke
Was steht als Status des letzten Tests in den SMART Daten ?
Der hier gestartete short-test sollte 1 min dauern. Nach 34 min sind
noch 50 % offen:
--------
Self-test execution status: ( 247) Self-test routine in
progress...
50% of test remaining.
--------
#13 Short offline Self-test routine in progress 50%
--------

Wenn es in dieser Geschwindigkeit weiter ginge, müsste er nach 68
min fertig sein, tatsächlich aber nach 120 min. Der Test wird zum
Ende hin also langsamer. Die Verlangsamung ist im Mittel 120-fach.
Post by Christian Franke
Läuft ein sehr kurzer "Selective" Test durch ?
Z.B. nur die ersten 10 Sektoren: smartctl -t select,0-9 /dev/ice
Ja, klappt tadellos.
Post by Christian Franke
Post by Werner Holtfreter
(Nr. 1 ist der jüngste Test. Nur der aktuell laufende Test
wird als höchste Nummer angezeigt und nach Beendigung zur
neuen Nr. 1 (schön ist anders)).
Für Verbesserungsvorschläge ist die Mailingliste
smartmontools-support at lists.sourceforge.net
auch ohne Subscription geöffnet :-)
Ich dachte, der Text käme so aus der Platte.
Post by Christian Franke
Post by Werner Holtfreter
Das Fehlerbild irritiert mich. Einerseits sollte ein Selbsttest
unabhängig vom System sein (zumindest, wenn wie hier im
Desktop-Einsatz, nicht ständig Verkehr auf der Platte herrscht).
Andererseits ist es nun schon die 2 Platte, die hier an meinem
Rechner dieses Problem zeigt. SMART-log der Platte ist sonst
unauffällig. Was ist da los?
Ist es die 2. Platte desselben Typs ?
Ja.
Post by Christian Franke
Zeigt der gleiche Plattentyp an einem anderen System ein anderes Verhalten ?
Ich habe nur einen Rechner. Aber ich habe mehrere Platten (auch des
gleichen Typs) in Wechselrahmen. Daher kann ich leicht die Platten
vergleichen.
--
Gruß Werner
Bedingungsloses Grundeinkommen:
www.jungefreiheit.de/Single-News-Display.268+M57f5b5a1a83.0.html
Christian Franke
2008-12-13 15:15:13 UTC
Permalink
Post by Werner Holtfreter
Post by Christian Franke
"Aborted by host" bedeutet normalerweise, dass der Test per SMART
Kommando (smartctl -X /dev/ice) abgebrochen wurde.
Bei Abbruch durch Reboot steht dort meistens "Interrupted (host reset)".
Gerade noch mal getestet: Hier erscheint bei Reboot und
bei "smartctl -X" immer "Aborted by host", bei zwei getesteten
Platten!
Ein "Interrupted (host reset)" wird gemeldet, wenn ich der Platte
die Stromversorgung abschalte (mit Wechselrahmen-Schalter).
Das ist so OK.
Post by Werner Holtfreter
Post by Christian Franke
Was steht als Status des letzten Tests in den SMART Daten ?
Der hier gestartete short-test sollte 1 min dauern. Nach 34 min sind
--------
Self-test execution status: ( 247) Self-test routine in
progress...
50% of test remaining.
--------
#13 Short offline Self-test routine in progress 50%
--------
Wenn es in dieser Geschwindigkeit weiter ginge, müsste er nach 68
min fertig sein, tatsächlich aber nach 120 min. Der Test wird zum
Ende hin also langsamer. Die Verlangsamung ist im Mittel 120-fach.
Selbst bei sonstiger Plattenaktivität sollte ein short-test nicht so
lange dauern. Ohne Aktivität sollte die angegebene Zeit etwa eingehalten
werden.
Post by Werner Holtfreter
Post by Christian Franke
Läuft ein sehr kurzer "Selective" Test durch ?
Z.B. nur die ersten 10 Sektoren: smartctl -t select,0-9 /dev/ice
Ja, klappt tadellos.
Post by Christian Franke
Post by Werner Holtfreter
(Nr. 1 ist der jüngste Test. Nur der aktuell laufende Test
wird als höchste Nummer angezeigt und nach Beendigung zur
neuen Nr. 1 (schön ist anders)).
Für Verbesserungsvorschläge ist die Mailingliste
smartmontools-support at lists.sourceforge.net
auch ohne Subscription geöffnet :-)
Ich dachte, der Text käme so aus der Platte.
Nein, in den SMART Daten und dem Log-Sektor stehen Binärwerte, die von
smartctl in den Erklärungstext aus dem ATA-Standard umgesetzt werden
(Ausnahme sind die Namen der SMART Attribute, die stehen leider nicht im
Standard).
Post by Werner Holtfreter
Post by Christian Franke
Post by Werner Holtfreter
Das Fehlerbild irritiert mich. Einerseits sollte ein Selbsttest
unabhängig vom System sein (zumindest, wenn wie hier im
Desktop-Einsatz, nicht ständig Verkehr auf der Platte herrscht).
Andererseits ist es nun schon die 2 Platte, die hier an meinem
Rechner dieses Problem zeigt. SMART-log der Platte ist sonst
unauffällig. Was ist da los?
Ist es die 2. Platte desselben Typs ?
Ja.
Post by Christian Franke
Zeigt der gleiche Plattentyp an einem anderen System ein anderes Verhalten ?
Ich habe nur einen Rechner. Aber ich habe mehrere Platten (auch des
gleichen Typs) in Wechselrahmen. Daher kann ich leicht die Platten
vergleichen.
Sollte dieses Verhalten bei mehreren Platten mit derselben
Firmwareversion auftreten, ist es vermutlich schlicht ein Firmwarefehler.

Gruß
Christian
Werner Holtfreter
2009-01-06 22:25:23 UTC
Permalink
Post by Christian Franke
Sollte dieses Verhalten bei mehreren Platten mit derselben
Firmwareversion auftreten, ist es vermutlich schlicht ein
Firmwarefehler.
Der Fehler tritt bei 4 typgleichen Platten aber zwei Firmwareständen
auf (3.AAE und 3.AAK). Bei den gleichzeitig installierten
PATA-Platten funktioniert der Test dagegen.
--
Gruß Werner
Bedingungsloses Grundeinkommen:
www.jungefreiheit.de/Single-News-Display.268+M57f5b5a1a83.0.html
Loading...