Im Laufe der Zeit kommt es bei Festplatten zu Ausfällen. Manche sterben schon kurz nach dem Kauf, das sogenannte Montagsmodell, und wieder andere halten wenigstens bis zum Garantieende durch. Das ist allerdings auch wieder schlecht für Sie, wenn diese kurz nach Ablauf der Garantie kaputt gehen.
Vertraue nie der DSM Zustandsanzeige der Festplatten!
In der Vergangenheit wurden Nutzer oft überrascht, da scheinbar von jetzt auf gleich eine Festplatte ausfiel. Das ist aber meistens nicht der Fall. Die betroffene Festplatte hatte wahrscheinlich schon seit Wochen oder Monaten einen bedenklichen Zustand erreicht. Das DSM erkennt jedoch nicht immer sofort, ob da etwas im Argen liegt. Es fällt eher auf, wenn man einen einfachen S.M.A.R.T. Test plant und dies täglich durchführt. Das ist vertretbar und dauert nur ein paar Minuten.
Von dem erweiterten S.M.A.R.T. Test rate ich jedoch dringend ab, da dies mehrere Stunden dauern kann und die Platte stark beansprucht wird. Das lässt sie deutlich schneller altern und außerdem möchten Sie diesen erweiterten S.M.A.R.T. Test nicht durchführen, wenn die Platte kurz vorm Ableben ist!
Der Seagate IronWolf Health Test ist herstellerfreundlich und handelt stets im Interesse des Herstellers. Daher wird da auch gerne ein oder beide Augen zugedrückt, selbst wenn die Platte nicht mehr in Ordnung ist. Daher gilt: Schauen Sie sich die S.M.A.R.T. Werte aller Festplatten im Detail regelmäßig sehr genau an! Benutzen Sie keine Herstellerdiagnosetools, um sich den Zustand der Festplatte bewerten zu lassen. Wenn das Wissen fehlt, fragen Sie in entsprechenden Foren nach.
Was sind die Anzeichen für einen bevorstehenden Ausfall einer Festplatte in Ihrer Synology NAS?
Auffälligkeiten der Hardware
- Sie hören eine Ihrer Festplatten deutlicher als sonst. Sie wird lauter.
- Klick- und Klackergeräusche sind auch sehr verdächtig und sollten Sie hellhörig werden lassen.
- Schrille/kreischende Geräusche. Da liegt wohl der Arm auf der Platte auf. Nicht gut!
- Die HDD LEDs der Synology NAS verhalten sich auffällig. In Kombination mit dem nicht-reagieren der DSM Oberfläche oder bei einer deutlich wahrnehmbaren Trägheit, sollten Sie dies prüfen. Am besten im Ruhezustand ohne Zugriffe. Gesunde Platten leuchten meist dauerhaft, während die defekte Platte durch Blinken auffällt. Gerade bei einem RAID-Verbund können Sie direkt erkennen, welche Platte voraussichtlich kaputt ist.
Auffälligkeiten der Software/DSM
- Wenn Sie modellgleiche Festplatten im System verbaut haben, ist es einen Blick wert, wie warm jede einzelne Platte wird. Auffällig wäre es auch, wenn eine deutlich wärmer ist als alle anderen.
- Ihre NAS wird träge! Meist geht das mit fehlerhaften Sektoren einher. Wenn versucht wird, auf defekte Bereiche zuzugreifen, versucht die Platte, den Sektor erneut zu lesen. Er wird als Offline_Uncorrectable markiert, wenn er nicht wiederhergestellt werden kann.
- Kopier- und/oder Schreibvorgänge brechen ab oder haken hin und wieder.
- Auch ein BSOD des Clients beim Kopieren/Löschen ist keine Seltenheit.
- Auftretende Datei CRC-Fehler (Cyclic Redundancy Checksum).
- Sie können sich nicht mehr in das DSM einloggen. Das ist lediglich ein Indiz, dass die Festplatte eventuell kurz vorm Totalausfall steht.
Volume fehlerhaft/abgestürzt
Finden Sie unbedingt den Grund dafür heraus! Die fehlerhafte Platte einfach wieder einzubinden, ohne sich Gedanken über den Grund zu machen, ist leichtsinnig und wird auch meistens bestraft.
Ein einfacher Grund kann sein, dass die Platte nicht richtig im Slot steckt, dass das Kabel defekt ist oder die Kontakte verschmutzt sind. Im schlimmsten Fall ist der SATA-Controller defekt. Dann betrifft es jedoch meistens mehrere Ports.
Beim Umstellen, Transportieren des Geräts an einen anderen Ort, beim Austauschen von Festplatten oder beim Säubern des Geräts kann es zu solchen Problemen kommen. Der UltraDMA-CRC-Error Wert fällt dann von 200 ab. Das DSM zeigt das unter anderem als “Neuverbindungen” an. Das muss jedoch nicht zwangsläufig heißen, dass die Festplatte defekt ist. Wenn es an einem Kabel oder an verdreckten Kontakten lag, steigt der Wert wieder auf 200, wenn Sie das Kabel getauscht oder die Kontakte gesäubert haben.
Wie Sie sehen, haben Sie genug Möglichkeiten herauszufinden, welche Platte in welchem Slot defekt ist. Schwierig wird es meistens nur dann, wenn Sie sich nicht mehr im DSM anmelden können. Ein Festplattenausfall führt nämlich nicht automatisch zum Auswurf der Platte aus dem Speicherpool. Daher Obacht! Fehlerhafte Sektoren machen die Platte nur träge.
In meinem speziellen Fall habe ich 4 Platten je 3TB in einem RAID 5/SHR1. Ich habe also die Ausfallsicherheit einer Festplatte.
Wie geht man denn jetzt am besten vor, wenn eine Anmeldung in der DSM Oberfläche nicht mehr funktioniert und man somit auch nicht mehr nach gucken kann, was genau das Problem ist?
Das ist nicht so einfach, denn wenn Sie falsch vorgehen, ist Ihr gesamtes RAID 5 kaputt und auch alle Daten wären dann verloren. Je nach RAID-Typ müssen Sie vorsichtig vorgehen.
Meine Herangehensweise:
Sie können sich noch im DSM anmelden:
Im Speichermanager markieren Sie die fehlerhafte Platte und klicken im Anschluss auf Laufwerk identifizieren. Dadurch wird die markierte Platte für die angegebene Zeit markiert. Die LED der NAS des betroffenen Laufwerksschachts wird dann orange aufleuchten, bis die Zeit abgelaufen ist oder Sie die Platte getauscht haben.
Bei kleinen NAS Systemen ist meistens klar, welcher Schacht der Dritte ist. Wenn die Laufwerksschächte nicht beschriftet sind, schauen Sie in das Handbuch nach der Belegung.
Sie können sich nicht mehr im DSM anmelden:
Fahren Sie die Synology NAS herunter. Ziehen Sie die auffällige Platte aus dem Schacht heraus und bauen Sie diese temporär in einen Rechner ein. Verwenden Sie ein S.M.A.R.T.-Tool wie CrystalDiskInfo unter Windows oder Gsmartcontrol unter Linux, um die S.M.A.R.T. Werte auszulesen. Achten Sie besonders auf Werte wie Pending Sectors, Offline_Uncorrectable, Relocated Sectors, UltraDMA-CRC-Error, Multi-Zone Error und End-to-End-Error. Wenn die Rohwerte nicht den Wert 0 haben, haben Sie die richtige Platte erwischt.
In seltenen Fällen ist selbst das Auslesen der S.M.A.R.T. Werte nicht mehr möglich. Wenn das der Fall ist, haben Sie jedoch die richtige Platte erwischt.
- Schnappen Sie sich ein S.M.A.R.T.-Tool wie CrystalDiskInfo unter Windows oder Gsmartcontrol unter Linux.
- CrystalDiskInfo wird Sie durch einen Warnton darauf hinweisen, dass mit der Platte etwas nicht stimmt.
- Achten Sie besonders auf Werte wie Pending Sectors, Offline_Uncorrectable, Relocated Sectors, UltraDMA-CRC-Error, Multi-Zone Error und End-to-End-Error.
- Es gibt natürlich noch andere Werte, aber diese sind der Grund, warum die meisten Festplatten ausfallen. Die müssen halt auch mal schlafen.
Sie können die Synology NAS in einem RAID 5/SHR1 auch ohne die defekte Platte hochfahren. Natürlich wird das Volume degraded sein, aber Sie können so lange warten, bis die neue Platte eintrifft. Denken Sie daran, dass wenn noch eine weitere Platte ausfällt, alle Ihre Daten verloren gehen. Daher sollten Sie das System schonen und keine wilden Kopierorgien starten. Als Randnotiz sollten wichtige Daten immer in doppelter oder dreifacher Ausführung vorliegen. Ein Off-site Backup ist immer Pflicht für kritische Daten.