Raid1 mit zwei Platten, SMART-Probleme

Hallo,

wer kennt sich mit dem Problem aus?

Ich habe unter Linux ein Software-Raid mit zwei parallelen Platten eingerichtet.

Bei einer der Platten meldet mir der smartd immer wieder mehrere Sektoren, die nicht gelesen werden können.

Kann ich das, bis zum endgültigen Ausfall ignorieren? Voraus gesetzt, die andere Platte ist in Ordnung!

Klar ist mir, daß ich da auf dünnem Seil laufe, brauche aber mal eine Einschätzung von Leuten, die sich damit auskennen.

Blöd wäre ja, beim ersten Auftreten von solchen Fehlern immer die ganze ganze Platte zu ersetzen!

MfG Günter

Hallo,

es gibt die Möglichkeit die defekten Sektoren quasi auzuklammern, aber das ist höhere Kunst, und besser wird die Platte auch nicht davon. Weiter musst du dann ja die Partitionen auf der ersten Fetplatte auch anpassen wegen dem Größenunterschied.

Das ist aber keine akzeptable Lösung,Du spielst mit dem Feuer.

Weiter sind Festplatten nicht mehr so teuer als das man nicht alle 2 Jahre in die Datensicherheit 100 € Reinstecken könnte.

Aber wenn du sicher gehen möchtest kaufst du Dir nen SAS-Controler und zwei z.B. SEAGATE ConstellationES7200
dann hast Du für knapp 300€ ein ordentliches Sicherungssystem das auch ne weile hält.

Wenn der smartd schon defekte Sektoren meldet, dann würde ich das Raid so nicht mehr weiter betreiben, da das RAID nun schon in einem inkonsistenten Zustand ist. D.h. wenn nun die andere Platte plötzlich kaputt geht, dann ist ein Datenverlust zu erwarten.
Außerdem werden die Schreibvorgänge im RAID jetzt langsamer sein, da er bei den Sektoren, die defekt sind unter Umständen mehrfach zu schreiben versucht.

Die Idee eines RAID ist, dass ein Defekt einer Platte noch nicht zu Datenverlusten führt und Du somit Zeit hast die defekte Platte zu tauschen. Wenn Du nun warten willst, dann kannst Du auch gleich die angeschlagene Platte ausbauen (dann braucht sie auch keinen Strom mehr) und warten bis die andere kaputt ist, damit Du endlich Deinen Datenverlust hast :smile:

Gruß

schmueller

Hallo … habe da leider keine Info drüber.

hallo günter,

damit kenne ich mich nicht aus.

würde aber mal folgendes probieren: wenn es immer die gleichen sektoren sind -> die daten sichern und neu formatieren, dann werden die defekten sektoren in der regel nicht mehr genutzt.

gruss phil

Hallo Phil,
Danke für die Antwort.

würde aber mal folgendes probieren: wenn es immer die gleichen
sektoren sind -> die daten sichern und neu formatieren, dann
werden die defekten sektoren in der regel nicht mehr genutzt.

so etwas ähnliches habe ich auch vor, zumal der Verbund sowieso etwas schrottig ist:
Nur eine Platte hat eine Partitionstabelle, die andere nicht. Ich glaube, das Aufsetzen war wohl nicht optimal.

Weil man einen Verbund (unter Linux) nicht partitionieren kann, habe ich ein LVM darüber gesetzt.
Der Verbund wird mir als synchron gemeldet (cat /proc/mdstat).

Ich habe die Dateien schon weitgehend woanders hin gesichert und werde demnächst das Ganze mit den Bordmitteln von Ubuntu (palimpset) neu aufsetzen … also erst den Verbund, dann darüber ein LVM, und der wird partitioniert.
Meine Erwartung ist, daß dann der Verbund auch automatisch beim Systemstart aktiv wird.
Angelegt hatte ich das unter Knoppix.

Interessanterweise habe ich heute mit smartctl die beiden Raid-Platten in einem Live-System einem Long-Test unterworfen. Dabei wurden *keine Fehler* festgestellt!

In der Mail, welche mir von System geschickt wurde, stand nur 25 Sektoren, aber nicht welche. Ich muß mal forschen, wo ich die Detail-Informationen finde.

Soweit erst einmal Danke

Günter

Hallo schmueller,
Danke für die Antwort.

Wenn der smartd schon defekte Sektoren meldet, dann würde ich
das Raid so nicht mehr weiter betreiben, da das RAID nun schon
in einem inkonsistenten Zustand ist. D.h. wenn nun die andere
Platte plötzlich kaputt geht, dann ist ein Datenverlust zu
erwarten.

ich habe die betreffenden Platten heute mit smartctl einem Long-Test unterzogen, bei dem aber *keine Fehler* gefunden wurden!
Der Test lief in einem Live-System, ohne aktivem Verbund, um irgend welche Wechselwirkungen auszuschließen.

Außerdem werden die Schreibvorgänge im RAID jetzt langsamer
sein, da er bei den Sektoren, die defekt sind unter Umständen
mehrfach zu schreiben versucht.

auf dem Verbund sitzt noch ein LVM, der mit ext3 (oder ext4) formatiert ist.
Ich gehe eigentlich davon aus, daß beide Platten letztendlich auch eine Art ext System haben, bin mir aber nicht sicher. Wenn dem so wäre, hätten die beiden Platten (Raid1) keine spiegelbildliche Speicherung, sondern eine logische Verteilung. Damit sollten einzelne Sektoren keine Störungen hervor rufen.

Mit ‚cat /proc/mdstat‘ werden mir *beide Platten als synchron gemeldet*.

Die Idee eines RAID ist, dass ein Defekt einer Platte noch
nicht zu Datenverlusten führt und Du somit Zeit hast die
defekte Platte zu tauschen.

das ist ja - im Grunde genommen - meine Frage:
ist *wirklich* schon bei *einem* fehlerhaften Sektor die Platte - bzw der Verbund - schon aus dem Ruder?

Wenn Du nun warten willst, dann
kannst Du auch gleich die angeschlagene Platte ausbauen …

ich habe die Dateien schon weitgehend auf einer anderen Platte/Partition gesichert und will den Verbund mit LVM vollkommen neu aufsetzen, diesmal mit Bordmitteln von Ubuntu (statt mit Knoppix) … wenn dann immer noch (nachvollziehbare) Fehler gemeldet werden, muß die Platte ausgetauscht werden.

Was mich sowieso verwundert:

Beide Platten haben die Signatur ‚Teil eines Verbundes‘, aber nur eine hat eine Partitionstabelle! Von daher gehe ich davon aus, daß die beiden Platten eben *keine* gespiegelten Sektoren sind, sondern irgend etwas anderes.

Ich werde, wie gesagt, den Verbund mal neu aufsetzen und hier Bericht erstatten.

Erst einmal Danke für Deine Tipps.

Günter

Hallo Daniel,
Danke für Deine Antwort.

es gibt die Möglichkeit die defekten Sektoren quasi
auzuklammern, aber das ist höhere Kunst

wie wäre das zu bewerkstelligen?
Ein Lauf mit smartctl unter einem Ubuntu-Live-System hat beide Platten als Fehlerfrei gemeldet!
Ich kenne da bestenfalls badblocks … aber dazu müßte ich erst einmal wissen, um welche Blocks es sich handelt!
Die smart-Meldung lautete nur „… offline uncorrectable sectors“ oder so (bin gerade nicht an dem betreffenden Rechner).

Weiter musst du dann ja die
Partitionen auf der ersten Fetplatte auch anpassen wegen dem
Größenunterschied.

das ist ja das verrückte daran:

a) cat /proc/mdstat meldet beide Platten synchron!

b) beide Platten haben die Signatur ‚Teil eines Raid1‘

c) nur eine der Platten hat eine Partitions-Tabelle (wer die wann angelegt hat, ist mir nicht klar. Eine Partitionierung *einer* Platte ist gar nicht möglich! Selbst den Raid1-Verbund kann man nicht Partitionieren! Aus dem Grund liegt noch ein LVM darüber.

Laut Literatur hat der Verbund - bei unterschiedlichen Platten im Raid1 - die Kapazität der kleineren Platte … also bei 500GB noch kein Beinbruch.

Auch bin ich mir nicht im Klaren darüber, was sinnvoller ist:

Die ganze Platte als Teil des Verbundes oder nur die erste (und einzigste) Partition!
Zur Zeit sind es die jeweils erste Partition, die aber die gesamte Kapazität der Platte hat. Wobei, wie gesagt, nur eine der Platten eine Partitions-Tabelle hat!

Das kommt davon, wenn man keine eindeutigen Anleitungen hat, sondern herum experimentiert!

Das ist aber keine akzeptable Lösung,Du spielst mit dem Feuer.

darüber bin ich mir im Klaren!

Weiter sind Festplatten nicht mehr so teuer als das man nicht
alle 2 Jahre in die Datensicherheit 100 € Reinstecken könnte.

nun, eigentlich gehe ich davon aus, daß ich mich noch in der Garantiezeit befinde … ich muß mal die Rechnung raus suchen.

Aber wenn du sicher gehen möchtest kaufst du Dir nen
SAS-Controler

Für meinen Server habe ich mir schon einen HW-Controller zugelegt, den aber noch nicht verbaut. Da will ich dann ein Raid5 mit mindestens 3 Platten aufsetzen.
Die Versuche mit dem aktuellen Rechner sollen klären, ob es wirklich ein Raid5 (als HW-System) sein muß, oder ob ein Raid1 reicht. Man hört da unterschiedliche Auffassungen.

Ich betreibe keine Firma oder so, will nur eine verbesserte Datensicherheit in meinem lokalen Netz!

Gruß Günter

Hallo,

Ja du hast recht es geht dabei um badblocks.
http://claw.triple6.org/linux/badblocksfestplatten-a…

der Link kann Dir da sicher weiterhelfen.

Was den Rest angeht, da kann ich dir nicht mehr wirklich weiterhelfen.