Self-Monitoring Analysis and Reporting Technology

Aus Mikiwiki
Zur Navigation springen Zur Suche springen

Die Self-Monitoring Analysis and Reporting Technology / SMART (dt. "System zur Selbstüberwachung, Analyse und Statusmeldung") ist ein Industriestandard, der seit Mitte der 1990er Jahre in der Firmware aller modernen ATA-, SATA- und SCSI-Festplatten sowie SCSI-Bandlaufwerk eingebaut wird. Sie ermöglicht die dauernde Überwachung und Protokollierung wichtiger Leistungsdaten und somit das frühzeitige Erkennen drohender Ausfälle. Zusätzlich sind verschiedene Testroutinen integriert.

Die Smartmontools dienen dazu, die SMART-Funktionen der Speichergeräte aufzurufen und zu steuern.

Funktionsweise

Neben der laufenden Protokollierung von Messwerten und Fehlern sind auch Funktionen zum Selbsttest der Geräte eingebaut. SMART legt die gesammelten Daten in einem reservierten Festplattenbereich ab, der sich vom Benutzer nicht überschreiben lässt. Allerdings gehen die Hersteller dabei nicht nach einem einheitlichen Schema vor - sie messen hauptsächlich, was sie selbst für wichtig halten. Dabei werden etwa Temperatursensoren ungenau eingestellt oder an der falschen Stelle plaziert. Google testete SMART über neun Monate ausführlich mit 100'000 Platten verschiedener Hersteller, wobei die Trefferquote der Technik immerhin bei 64 Prozent lag.

Konkret wird zwischen ausfallrelevanten und informativen Rohdaten unterschieden. Die gemessenen Werte zu den Eigenschaften (engl. attributes) ordnen die Hersteller auf Skalen zwischen 0 bis 100 oder 1 bis 253 ein - über die Feinheit bestimmen sie selbst.Trotz der voneinander abweichenden absoluten Messwerte können die Eigenschafte unterschiedlicher Festplatten so miteinander verglichen werden. Bei neuen Festplatten liegen die Werte für die Eigenschaften meist beim Maximum und sinken dann mit fortschreitendem Alter in Richtung Null, doch kommt auch der umgekehrte Fall vor. Erreicht ein ausfallrelevanter Eigenschaftswert einen bestimmten Schwellenwert (engl. threshold), so bewertet SMART das als Problem. Auch die genannten Voreinstellungen (engl. presets) der Hersteller unterscheiden sich zuweilen: Bezeichnet Nummer 9 bei einer Platte die "Seek error rate", kann es sich bei einer anderen um die "Spin up time" handeln.

Ausfallrelevante SMART-Eigenschaften
Eigenschaft Fehler ist möglicher Hinweis auf
Seek Error Rate Positionierungsproblem der Lese- und Schreibeinheit
Raw Error Read Rate Problem mit dem Plattenoberfläche (Lesefehler)
Hardware ECC Recovered Problem mit dem Plattenoberfläche (Magnetfelder der einzelnen Bit überlappen)
Throughput Performance Probleme mit der Laufwerksmechanik (Effizienz der Festplatte leidet)
Spin Up Time Probleme mit Motor oder Plattenlagern (Beschleunigung der Festplatte dauert zu lange)
Spin Retry Count Probleme mit mechanischem Subsystem (mehrere Anläufe, bis die Festplatte sich dreht)
Reallocated Sector Count Zu viele verbrauchte Reservesektoren
Current Pending Sector Count Instabile Sektoren, die auf Remapping warten
HDA Temperature Zu hohe Betriebstemperatur

Weblinks

Herausgeber Sprache Webseitentitel Anmerkungen
Wikipedia ger Self-Monitoring, Analysis and Reporting Technologywbm Enzyklopädischer Artikel
Wikipedia eng Self-Monitoring, Analysis and Reporting Technologywbm Enzyklopädischer Artikel
SMARTLinux eng Attributeswbm
Google eng Failure trends in a large disk drive populationwbm PDF-Datei mit Testergebnissen