Self-Monitoring Analysis and Reporting Technology
Die Self-Monitoring Analysis and Reporting Technology / SMART (dt. "System zur Selbstüberwachung, Analyse und Statusmeldung") ist ein Industriestandard, der seit Mitte der 1990er Jahre in der Firmware aller modernen ATA-, SATA- und SCSI-Festplatten sowie SCSI-Bandlaufwerk eingebaut wird. Sie ermöglicht die dauernde Überwachung und Protokollierung wichtiger Leistungsdaten und somit das frühzeitige Erkennen drohender Ausfälle. Zusätzlich sind verschiedene Testroutinen integriert.
Die Smartmontools dienen dazu, die SMART-Funktionen der Speichergeräte aufzurufen und zu steuern.
Funktionsweise
Neben der laufenden Protokollierung von Messwerten und Fehlern sind auch Funktionen zum Selbsttest der Geräte eingebaut. SMART legt die gesammelten Daten in einem reservierten Festplattenbereich ab, der sich vom Benutzer nicht überschreiben lässt. Allerdings gehen die Hersteller dabei nicht nach einem einheitlichen Schema vor - sie messen hauptsächlich, was sie selbst für wichtig halten. Dabei werden etwa Temperatursensoren ungenau eingestellt oder an der falschen Stelle plaziert. Google testete SMART über neun Monate ausführlich mit 100'000 Platten verschiedener Hersteller, wobei die Trefferquote der Technik immerhin bei 64 Prozent lag.
Konkret wird zwischen ausfallrelevanten und informativen Rohdaten unterschieden. Die gemessenen Werte zu den Eigenschaften (engl. attributes) ordnen die Hersteller auf Skalen zwischen 0 bis 100 oder 1 bis 253 ein - über die Feinheit bestimmen sie selbst.Trotz der voneinander abweichenden absoluten Messwerte können die Eigenschafte unterschiedlicher Festplatten so miteinander verglichen werden. Bei neuen Festplatten liegen die Werte für die Eigenschaften meist beim Maximum und sinken dann mit fortschreitendem Alter in Richtung Null, doch kommt auch der umgekehrte Fall vor. Erreicht ein ausfallrelevanter Eigenschaftswert einen bestimmten Schwellenwert (engl. threshold), so bewertet SMART das als Problem. Auch die genannten Voreinstellungen (engl. presets) der Hersteller unterscheiden sich zuweilen: Bezeichnet Nummer 9 bei einer Platte die "Seek error rate", kann es sich bei einer anderen um die "Spin up time" handeln.
Ausfallrelevante SMART-Eigenschaften | |
---|---|
Eigenschaft | Fehler ist möglicher Hinweis auf |
Seek Error Rate | Positionierungsproblem der Lese- und Schreibeinheit |
Raw Error Read Rate | Problem mit dem Plattenoberfläche (Lesefehler) |
Hardware ECC Recovered | Problem mit dem Plattenoberfläche (Magnetfelder der einzelnen Bit überlappen) |
Throughput Performance | Probleme mit der Laufwerksmechanik (Effizienz der Festplatte leidet) |
Spin Up Time | Probleme mit Motor oder Plattenlagern (Beschleunigung der Festplatte dauert zu lange) |
Spin Retry Count | Probleme mit mechanischem Subsystem (mehrere Anläufe, bis die Festplatte sich dreht) |
Reallocated Sector Count | Zu viele verbrauchte Reservesektoren |
Current Pending Sector Count | Instabile Sektoren, die auf Remapping warten |
HDA Temperature | Zu hohe Betriebstemperatur |
Weblinks
Herausgeber | Sprache | Webseitentitel | Anmerkungen |
---|---|---|---|
Wikipedia | ger | Self-Monitoring, Analysis and Reporting Technologywbm | Enzyklopädischer Artikel |
Wikipedia | eng | Self-Monitoring, Analysis and Reporting Technologywbm | Enzyklopädischer Artikel |
SMARTLinux | eng | Attributeswbm | |
eng | Failure trends in a large disk drive populationwbm | PDF-Datei mit Testergebnissen |