/ / Ausfall des Ersatzlaufwerks während des nas4free ZFS-Resilvers - zfs, Festplattenausfall

Ausfall des Ersatzlaufwerks während des nas4free ZFS-Resilvers - zfs, Festplattenausfall

Ich verwende nas4free v. 10.3.0.3., mit ZFS, mit einem 4-TB-Laufwerk RaidZ1. Einmal im Jahr f√ľhre ich eine vollst√§ndige Sicherung durch, setze das √§lteste Laufwerk offline, ersetze es durch ein neues Laufwerk und gebe den Befehl "zpool replace mytank / dev / ada0" aus. Anschlie√üend wird der Resilver automatisch gestartet.

Dieses Wochenende habe ich den Prozess gestartet, genau wieimmer. Zu diesem Zeitpunkt betrug die Zeit bis zur Fertigstellung etwa 8 Stunden. Nach mehr als 24 Stunden ist der Resilver jedoch immer noch nicht fertig. Auf dem Bildschirm Disks | ZFS | Pools | Information wird angezeigt, dass der Resilvering-Prozess immer wieder neu gestartet wird. Derzeit sind 0,14% fertig dieser Punkt mehrmals vor.

Da ich wusste, dass Resilvering die Laufwerke belastet, habe ich smartctl f√ľr jedes einzelne Laufwerk ausgef√ľhrt. Die drei "alten" Laufwerke zeigen √ľberhaupt keine Fehler. Alles ist "normal".

Das "neue" Laufwerk ist jedoch nicht "t. Hier sind einige relevante Zeilen aus der smartctl-Ausgabe:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct   0x0033   001   001   005    Pre-fail  Always   FAILING_NOW 0
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   001   001   000    Old_age   Always       -       2000

SMART Error Log Version: 1
ATA Error Count: 270 (device log contains only the most recent five errors)

Ja, ich denke, das Laufwerk fällt aus.

Nun meine Fragen:

1) Wie kann ich die fehlerhafte Festplatte offline schalten? So wie ich es immer tue?

2) Wird der Resilver-Prozess durch das "Offline-Schalten" der fehlerhaften Festplatte gestoppt?

3) Nach dem Ersetzen der defekten Festplatte und dem Ausstellen der zpool replace Befehl, startet der Resilver automatisch wieder?

Danke f√ľr Ihre Hilfe.

Antworten:

0 f√ľr Antwort ‚ĄĖ 1
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct   0x0033   001   001   005    Pre-fail  Always   FAILING_NOW 0
197 Current_Pending_Sector  0x0022   001   001   000    Old_age   Always       -       2000

Sieht f√ľr mich aus, als h√§ttest du eine Zitrone. Solche Dinge passieren; RMA die Festplatte und einen Ersatz bekommen. Bei einem k√ľrzlich get√§tigten Kauf, einer voraussichtlich geringen Betriebsstundenzahl und von SMART angezeigten Fehlern sollte dies kein Problem sein. Wenn der Reseller diesbez√ľglich Probleme hat, suchen Sie einen anderen Reseller und kaufen Sie stattdessen dort ein.

1) Wie kann ich die fehlerhafte Festplatte offline schalten? So wie ich es immer tue?

Sie k√∂nnen eine Festplatte jederzeit mit offline schalten zpool offline <pool> <dev>. Achten Sie einfach darauf, √ľber der Redundanz zu bleibenSchwelle des Pools. (Ich glaube nicht, dass Sie mit ZFS einen Datentr√§ger entfernen k√∂nnen, der einen Pool unter seine Redundanzschwelle bringt, ohne dazu gezwungen zu werden, und dass dies m√∂glicherweise nicht einmal dann der Fall ist, aber es ist einfach, in die Falle des Hinzuf√ľgens des Datentr√§gers zu tappen -f ohne √ľber die Konsequenzen nachzudenken.)

2) Wird der Resilver-Prozess durch das "Offline-Schalten" der fehlerhaften Festplatte gestoppt?

Es sollte, da es jetzt kein Resilvering mehr gibtmuss getan werden. Beachten Sie jedoch, dass Sie keine Redundanz haben. Daher sind alle Fehler (auch E / A-Fehler auf Sektorebene), während sich der Pool in dieser Konfiguration befindet, möglicherweise kritisch.

3) Wird der Resilver nach dem Ersetzen der fehlerhaften Festplatte und der Ausgabe des Befehls zpool replace automatisch neu gestartet?

M√∂glicherweise m√ľssen Sie zpool online die neue festplatte wurde da die alte genommen offline, aber ich glaube nicht. Konzeptionell zpool replace <pool> <old> <new> ist dasselbe wie zpool attach <pool> <new> gefolgt von zpool detach <pool> <old> (aber Sie k√∂nnen "keine Ger√§te in einem raidz vdev anh√§ngen / trennen").

F√ľr ZFS ben√∂tigt die neue Ersatzfestplatte ein Resilver, daher wird ein Resilver gestartet.

Trotzdem ist mir dieser Teil Ihrer Frage aufgefallen:

vier 2 TB Laufwerk RaidZ1. Einmal im Jahr mache ich eine vollständige Sicherung, Offline das älteste Laufwerk, ersetzen Sie es mit einem neuen Laufwerk und geben Sie den Befehl "zpool replace mytank / dev / ada0" ein,

Ich w√ľrde Sie ermutigen, die alte Festplatte nicht vor der Installation der neuen zu entfernen, insbesondere wenn es ertr√§glich gut funktioniert. (Ich hatte einen Plattenstart, der Fehler von der blo√üen Seite hervorbrachte habe gedacht In diesem Fall kann es sinnvoll sein, die fehlerhafte Festplatte zu entfernen oder zu entfernen.) Schlie√üen Sie die neue Festplatte neben der alten an zpool replace <pool> <old> <new>. Auf diese Weise erhalten Sie den Vorteil derRedundanz, die Sie im Pool haben; Wenn dann eine der anderen Festplatten w√§hrend des Resilvers auf ein Problem st√∂√üt, ist die Wahrscheinlichkeit sehr viel h√∂her, dass das System dies ordnungsgem√§√ü und ohne Datenverlust handhaben kann.

Bei der sehr F√ľhren Sie mindestens ein zpool scrub auf dem Pool unmittelbar vor dem Auslagern der zu ersetzenden Festplatte.