Discussion:
Hilfe mit SMART-Bewertung
Lentes, Bernd
2014-09-10 15:57:04 UTC
Permalink
Hi,

ich habe hier eine Platte, die eben ein fsck beim Booten verlangt hat. Wenn ich mit smartctl drauf schaue, bekomme ich folgendes:

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 121151640
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 86997164
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15743
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 061 056 045 Old_age Always - 39 (Min/Max 29/39)
194 Temperature_Celsius 0x0022 039 044 000 Old_age Always - 39 (0 18 0 0 0)
195 Hardware_ECC_Recovered 0x001a 054 009 000 Old_age Always - 121151640
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 153734059408767
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483200717
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2193954941

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 4204 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch.
Der short und der offline Test haben keinen Fehler ergeben.
Was denkt Ihr ?

Bernd

--
Bernd Lentes

Systemadministration
Institut für Entwicklungsgenetik
Gebäude 35.34 - Raum 208
HelmholtzZentrum münchen
***@helmholtz-muenchen.de
phone: +49 89 3187 1241
fax: +49 89 3187 2294
http://www.helmholtz-muenchen.de/idg

Die Freiheit wird nicht durch weniger Freiheit verteidigt


Helmholtz Zentrum München
Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH)
Ingolstädter Landstr. 1
85764 Neuherberg
www.helmholtz-muenchen.de
Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe
Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen
Registergericht: Amtsgericht München HRB 6466
USt-IdNr: DE 129521671
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Kasimir Müller
2014-09-10 16:39:50 UTC
Permalink
Post by Lentes, Bernd
Hi,
SMART Attributes Data Structure revision number: 10
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 121151640
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 86997164
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15743
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 061 056 045 Old_age Always - 39 (Min/Max 29/39)
194 Temperature_Celsius 0x0022 039 044 000 Old_age Always - 39 (0 18 0 0 0)
195 Hardware_ECC_Recovered 0x001a 054 009 000 Old_age Always - 121151640
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 153734059408767
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483200717
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2193954941
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 4204 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch.
Der short und der offline Test haben keinen Fehler ergeben.
Was denkt Ihr ?
Bernd
--
Bernd Lentes
Systemadministration
Institut für Entwicklungsgenetik
Gebäude 35.34 - Raum 208
HelmholtzZentrum münchen
phone: +49 89 3187 1241
fax: +49 89 3187 2294
http://www.helmholtz-muenchen.de/idg
Die Freiheit wird nicht durch weniger Freiheit verteidigt
Helmholtz Zentrum München
Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH)
Ingolstädter Landstr. 1
85764 Neuherberg
www.helmholtz-muenchen.de
Aufsichtsratsvorsitzende: MinDirŽin Bärbel Brumme-Bothe
Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen
Registergericht: Amtsgericht München HRB 6466
USt-IdNr: DE 129521671
Die Platte läuft dauernd, ist sie für Serverbetrieb ?
Der Controller kann offensichtich die Fehler noch korrigieren,
aber ich würde die Platte sofort austauschen (ggf. nach letztem Backup).
Meine Laptop-Platte ist ca. 5J. alt und hat 0 Fehler !

mfg
K. Müller
Martin Schröder
2014-09-10 16:45:49 UTC
Permalink
Post by Lentes, Bernd
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch.
Der short und der offline Test haben keinen Fehler ergeben.
Was denkt Ihr ?
https://en.wikipedia.org/wiki/S.M.A.R.T.

Sieht alles gut aus.

Gruß
Martin
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Lentes, Bernd
2014-09-10 21:49:10 UTC
Permalink
Post by Lentes, Bernd
Post by Lentes, Bernd
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der
"worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch.
Post by Lentes, Bernd
Der short und der offline Test haben keinen Fehler ergeben.
Was denkt Ihr ?
https://en.wikipedia.org/wiki/S.M.A.R.T.
Sieht alles gut aus.
Hm,

der RAW-Wert ist sehr hoch (übrigens identisch mit Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist. Schwierig, da klare Aussagen zu treffen.


Bernd


Helmholtz Zentrum München
Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH)
Ingolstädter Landstr. 1
85764 Neuherberg
www.helmholtz-muenchen.de
Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe
Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen
Registergericht: Amtsgericht München HRB 6466
USt-IdNr: DE 129521671
&v'���^i��m�-zY^��!���(�z)�1��jz)z{.��^��칻�&ޢ�������ק.+-zp�)���ڶ�����z'!z{�'$z
Joerg Thuemmler
2014-09-11 06:20:03 UTC
Permalink
Post by Lentes, Bernd
Post by Lentes, Bernd
Post by Lentes, Bernd
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der
"worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch.
Post by Lentes, Bernd
Der short und der offline Test haben keinen Fehler ergeben.
Was denkt Ihr ?
https://en.wikipedia.org/wiki/S.M.A.R.T.
Sieht alles gut aus.
Hm,
der RAW-Wert ist sehr hoch (übrigens identisch mit Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist. Schwierig, da klare Aussagen zu treffen.
Bernd
Helmholtz Zentrum München
Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH)
Ingolstädter Landstr. 1
85764 Neuherberg
www.helmholtz-muenchen.de
Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe
Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen
Registergericht: Amtsgericht München HRB 6466
USt-IdNr: DE 129521671
Rgbx������޲ץ���r���҉碝��V������uﮞ˛���m�)z{.��+�I�zr�ק٢�+-��h�;����r���brG�J'��w�j)Z��^�ˬy׾� ޮ�^�ˬz�
Hi,

Du hast uns den Wert von
SMART overall-health self-assessment test result:
vorenthalten. "PASSED" ?

Das ist dann die Gesamtbewertung.
Bei mir (Areca-RAID 1 mit 2 WD1003FBYX) zeigt smartctl allerdings jeden
"Raw_Read_Error" (bzw. vielleicht auch eine Gruppe davon) einzeln an
(ich lasse alle smartctl-Werte regelmäßig gegen ihre Vorgängerwerte
testen und Unterschiede bei den relevanten melden).
Ich habe aber nur

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 27

und das bei Power-On-Hours: 24576 (die andere RAID-Platte hat nach 11000
Power-on-hours noch 0).

Vor 2 Jahren hat mir das RAID mal eine Platte degraded, die hatte bei
14000 Power-on-hours reichlich 15000 Raw_Read_Errors (aktuell benutze
ich sie allerdings als Testplatte, habe gerade 3x nacheinander OS13.1
drauf installiert, keine Fehler zu bemerken).

wenn Dein Raw_Read_Error_Rate wirklich bei 121151640 liegt, kann die
Platte eigentlich nur fast tot sein. Hat sich der Wert übrigens seit
Deiner Mail massiv geändert? Wie hoch ist er jetzt?

Abweichend von wiki würde ich der "seek error rate" doch etwas Gewicht
beimessen, auch wenn man nicht genau sagen kann, für welche Menge an
Fehlern er steht. Bei mir ist er jedenfalls auf beiden RAID-Platten 0.

Insgesamt würde ich sagen... Zeit für einen Wechsel, vielleicht brauchst
Du ja auch immer mal eine Platte für Testinstallationen, deren Verlust
harmlos wäre...

cu jth
--
www.teddylinx.de
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Lentes, Bernd
2014-09-11 11:28:13 UTC
Permalink
-----Ursprüngliche Nachricht-----
Gesendet: Donnerstag, 11. September 2014 08:20
Betreff: Re: Hilfe mit SMART-Bewertung
Post by Lentes, Bernd
Hm,
der RAW-Wert ist sehr hoch (übrigens identisch mit
Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen
Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu
verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist.
Schwierig, da klare Aussagen zu treffen.
Post by Lentes, Bernd
Bernd
Hi,
Du hast uns den Wert von
vorenthalten. "PASSED" ?
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Das ist dann die Gesamtbewertung.
Bei mir (Areca-RAID 1 mit 2 WD1003FBYX) zeigt smartctl allerdings jeden
"Raw_Read_Error" (bzw. vielleicht auch eine Gruppe davon) einzeln an (ich
lasse alle smartctl-Werte regelmäßig gegen ihre Vorgängerwerte testen und
Unterschiede bei den relevanten melden).
Ich habe aber nur
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 27
und das bei Power-On-Hours: 24576 (die andere RAID-Platte hat nach 11000
Power-on-hours noch 0).
Vor 2 Jahren hat mir das RAID mal eine Platte degraded, die hatte bei
14000 Power-on-hours reichlich 15000 Raw_Read_Errors (aktuell benutze ich
sie allerdings als Testplatte, habe gerade 3x nacheinander OS13.1 drauf
installiert, keine Fehler zu bemerken).
wenn Dein Raw_Read_Error_Rate wirklich bei 121151640 liegt, kann die
Platte eigentlich nur fast tot sein. Hat sich der Wert übrigens seit Deiner
Mail massiv geändert? Wie hoch ist er jetzt?
Abweichend von wiki würde ich der "seek error rate" doch etwas Gewicht
beimessen, auch wenn man nicht genau sagen kann, für welche Menge an
Fehlern er steht. Bei mir ist er jedenfalls auf beiden RAID-Platten 0.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 113 099 006 Pre-fail Always - 58304224
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 87096287
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15763
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 059 056 045 Old_age Always - 41 (Min/Max 29/43)
194 Temperature_Celsius 0x0022 041 044 000 Old_age Always - 41 (0 18 0 0 0)
195 Hardware_ECC_Recovered 0x001a 055 009 000 Old_age Always - 58304224
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 87625922788755
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483201189
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2832839630

Hi,

der RAW-Wert von "Raw_Read_Eroor_rate" hat sich verringert, auch der von "Hardware_ECC_Recovered". Scheint also nicht einfach nur die Zahl der Fehler zu sein, denn die hätte ja zunehmen müssen. Viell. ist es hier so wie Wiki schreibt, und die Hersteller kochen bei diesen Werten ihr eigenes Süppchen.
Die Seek-Error-Rate ist zwar im RAW-Wert hoch, aber nicht im normalisierten Wert.
Egal, ich tausche die Platte. Ist mir zu heiß, da laufen ein paar wichtige VM's drauf.


Bernd


Helmholtz Zentrum München
Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH)
Ingolstädter Landstr. 1
85764 Neuherberg
www.helmholtz-muenchen.de
Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe
Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen
Registergericht: Amtsgericht München HRB 6466
USt-IdNr: DE 129521671
�؞.+-y�󹷬��ez{�'$zt�y��xƢ�������ǝ{맲��r��z�^�ˬz��Rg^������vh���kj�+�竭蜅��r���
Joerg Thuemmler
2014-09-11 12:06:20 UTC
Permalink
Post by Lentes, Bernd
-----Ursprüngliche Nachricht-----
Gesendet: Donnerstag, 11. September 2014 08:20
Betreff: Re: Hilfe mit SMART-Bewertung
Post by Lentes, Bernd
Hm,
der RAW-Wert ist sehr hoch (übrigens identisch mit
Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen
Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu
verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist.
Schwierig, da klare Aussagen zu treffen.
Post by Lentes, Bernd
Bernd
Hi,
Du hast uns den Wert von
vorenthalten. "PASSED" ?
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Das ist dann die Gesamtbewertung.
Bei mir (Areca-RAID 1 mit 2 WD1003FBYX) zeigt smartctl allerdings jeden
"Raw_Read_Error" (bzw. vielleicht auch eine Gruppe davon) einzeln an (ich
lasse alle smartctl-Werte regelmäßig gegen ihre Vorgängerwerte testen und
Unterschiede bei den relevanten melden).
Ich habe aber nur
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 27
und das bei Power-On-Hours: 24576 (die andere RAID-Platte hat nach 11000
Power-on-hours noch 0).
Vor 2 Jahren hat mir das RAID mal eine Platte degraded, die hatte bei
14000 Power-on-hours reichlich 15000 Raw_Read_Errors (aktuell benutze ich
sie allerdings als Testplatte, habe gerade 3x nacheinander OS13.1 drauf
installiert, keine Fehler zu bemerken).
wenn Dein Raw_Read_Error_Rate wirklich bei 121151640 liegt, kann die
Platte eigentlich nur fast tot sein. Hat sich der Wert übrigens seit Deiner
Mail massiv geändert? Wie hoch ist er jetzt?
Abweichend von wiki würde ich der "seek error rate" doch etwas Gewicht
beimessen, auch wenn man nicht genau sagen kann, für welche Menge an
Fehlern er steht. Bei mir ist er jedenfalls auf beiden RAID-Platten 0.
SMART Attributes Data Structure revision number: 10
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 113 099 006 Pre-fail Always - 58304224
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 87096287
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15763
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 059 056 045 Old_age Always - 41 (Min/Max 29/43)
194 Temperature_Celsius 0x0022 041 044 000 Old_age Always - 41 (0 18 0 0 0)
195 Hardware_ECC_Recovered 0x001a 055 009 000 Old_age Always - 58304224
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 87625922788755
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483201189
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2832839630
Hi,
der RAW-Wert von "Raw_Read_Eroor_rate" hat sich verringert, auch der von "Hardware_ECC_Recovered". Scheint also nicht einfach nur die Zahl der Fehler zu sein, denn die hätte ja zunehmen müssen. Viell. ist es hier so wie Wiki schreibt, und die Hersteller kochen bei diesen Werten ihr eigenes Süppchen.
Die Seek-Error-Rate ist zwar im RAW-Wert hoch, aber nicht im normalisierten Wert.
Egal, ich tausche die Platte. Ist mir zu heiß, da laufen ein paar wichtige VM's drauf.
Bernd
Helmholtz Zentrum München
Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH)
Ingolstädter Landstr. 1
85764 Neuherberg
www.helmholtz-muenchen.de
Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe
Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen
Registergericht: Amtsgericht München HRB 6466
USt-IdNr: DE 129521671
Rgbx������޲ץ���r���҉碝��V������uﮞ˛���m�)z{.��+�I�zr�ק٢�+-��h�;����r���brG�J'��w�j)Z��^�ˬy׾� ޮ�^�ˬz�
Hi,

kann sein, es ist, wie bei manchen Herstellern mit der Temperatur, die
die als (z.B) 100-Wert angeben. Dann kriegt man automatisch 0, wenn der
kritische Wert erreicht ist.

Ich würde auch tauschen... so teuer ist so ein Blech ja nicht und es
gibt sicher noch eine unkritische Ecke dafür...

cu jth
--
www.teddylinx.de
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Manfred Kreisl
2014-09-11 13:22:55 UTC
Permalink
Hallo Bernd,

Am 11.09.2014 13:28, schrieb Lentes, Bernd:
[..]
Post by Lentes, Bernd
SMART Attributes Data Structure revision number: 10
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 113 099 006 Pre-fail Always - 58304224
Sehr seltsamer Wert, möglicherweise Fehlinterpretation
Post by Lentes, Bernd
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 87096287
9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15763
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 059 056 045 Old_age Always - 41 (Min/Max 29/43)
194 Temperature_Celsius 0x0022 041 044 000 Old_age Always - 41 (0 18 0 0 0)
195 Hardware_ECC_Recovered 0x001a 055 009 000 Old_age Always - 58304224
Ist die Platte vielleicht eine Samsung? oder ein Abkömmling davon? Ich
habe in meinem Raid 3 Samsung stecken (2x1TB und 1x1,5TB, und die
brachten schon vom ersten Tag an massive "Hardware_ECC_Recovered"
Fehler, die auch mal mehr und mal weniger waren stets im laufenden
Betrieb. Ich denke das ist da ein Wrap-Around. Diesem Wert würde ich
erst mal keine weitere Beachtung schenken.
Post by Lentes, Bernd
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 87625922788755
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483201189
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2832839630
Hi,
der RAW-Wert von "Raw_Read_Eroor_rate" hat sich verringert, auch der von "Hardware_ECC_Recovered". Scheint also nicht einfach nur die Zahl der Fehler zu sein, denn die hätte ja zunehmen müssen. Viell. ist es hier so wie Wiki schreibt, und die Hersteller kochen bei diesen Werten ihr eigenes Süppchen.
Die Seek-Error-Rate ist zwar im RAW-Wert hoch, aber nicht im normalisierten Wert.
Egal, ich tausche die Platte. Ist mir zu heiß, da laufen ein paar wichtige VM's drauf.
Ist bestimmt nicht das Verkehrteste, die Platte zu tauschen. Hast Du
denn eine identische Platte mit korrekten Wertem nur so zum Vergleich?

Ich traue seit einiger Zeit diesen Smart-Werten überhaupt nicht mehr
über den Weg. Habe da schon viel zu viel Sonderbarkeiten erlebt.
Beispielsweise bei einer 2,5" 500GB WDC Platte auf der definitiv immer
mal defekte Sektoren drauf waren, die ich durch Beschreiben dieser
wieder entfernen konnte, aber der "Reallocated_Sector_Ct" Wert ging nie
in die Höhe. Nach kurzer Zeit waren die defekten Sektoren dann an
anderer Stelle.

Gruß Manfred
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+***@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+***@opensuse.org
Lesen Sie weiter auf narkive:
Loading...