HILFE! RAID 5 nach Power-Reset kaputt

  • Hallo VDR-Gemeinde,


    Kann jemand bitte so freundlch sein, und versuchen mir zu helfen?


    Zwei Partitionen werden nach einem Power-Reset als defekt deklariert. Damit kann das RAID 5 nicht mehr zusammengebaut werden. --> Ich komme nicht mehr an meine Daten dran.


    Situation:


    4 x 1 TB S-ATA Samsung


    Je eine kleine und eine große Partition auf einer Platte


    4 x kleine Partionen --> md0 RAID 1 zum Booten, das geht noch
    4 x große Partionen --> md1 RAID 5 mit root, KAPUTT


    Ich benutze Ubuntu 8.04. Beim Updaten des Systems wurde gemeldet, dass nicht mehr genug Platz zum Speichern aller Pakete da ist. Irgendwann wurde die Kiste dann ganz lahm und ich wollte einen Neustart durchführen. Die Kiste lief teilweise runter, blieb ber dann stehen. Umschalten auf verschieden Terminals ging noch. Jedoch wurden Keyboardeingaben ignoriert. Auch CTRL-ALT-DEL half nicht. Die Kiste blieb einfach stehen.


    Nach einiger Zeit habe ich dann den "Stecker gezogen" :versteck


    Und jetzt? Hat jemand eine Idee? fsck.ext3 auf die einzelnen Partionen laufen lassen und dann hoffen, dass danach das Array wieder zusammengebaut werden kann?



    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Naja, grundsätzlich könnte es möglich sein...
    werden ja immer 3x daten und 1x parität gespeichert...
    Wenn da pro Datenhappen jeweils nur eines defekt ist sollte es sich restaurieren lassen.
    Wäre jedoch keine standard restaurierung ala platte raus und neue rein...
    Kann da leider auch nicht viel mehr zu sagen.

  • Zitat

    Original von pbriesch
    Kann jemand bitte so freundlch sein, und versuchen mir zu helfen?


    Versuchen kann ich das :gap


    Zitat

    Zwei Partitionen werden nach einem Power-Reset als defekt deklariert. Damit kann das RAID 5 nicht mehr zusammengebaut werden. --> Ich komme nicht mehr an meine Daten dran.


    Ich kenne einen Weg, wie man das mit den alten md-tools hinbekommt. Wie das mit dem mdadm geht, weiss ich nicht. Evtl. musst Du irgendwie die alten Tools installieren.


    Zitat

    fsck.ext3 auf die einzelnen Partionen laufen lassen und dann hoffen, dass danach das Array wieder zusammengebaut werden kann?


    Au weia! bloss nicht! Bei RAID5 ist ja auf den einzelnen Partitionen kein Dateisystem drauf- wenn Du fsck da drueberjagst, ist alles vorbei!


    Also, Abhilfe nach der "ICH HABE DICH GEWARNT, ES KANN ALLES SCHIEFGEHEN" Methode:
    Bei Deinem Array mag er sda2 und sdb2 nicht mehr, richtig?
    Na dann brauchst Du zuerst eine /etc/raidtab (kann auch gerne leer sein, soweit ich mich erinnere) und die raid-tools.

    Code
    mkraid --dangerous-no-resync /dev/md1


    Das baut das Array wieder auf, ohne es zu loeschen. Sollten aber Inkonsistenzen zwischen den einzelnen Bloecken auftreten, kann es zu Datenverlusten bei den betroffenen Dateien kommen. Erfahrungsgemaess sind das (wenn ueberhaupt) aber nur wenige.
    Laeuft das Array dann wieder, bringe es dazu, eine der beiden (vormals fehlerhaften) Partitionen als falsch zu deklarieren.Irgendwo konnte man mal feststellen, welches der beiden das "Neuere" ist. Glaube, waehrend des bootens, weiss ich jetzt aber nicht mehr.

    Code
    raidsetfaulty /dev/md1 /dev/sda2
    raidhotremove /dev/md1 /dev/sda2

    Und dann kannst Du wieder die "fehlerhafte" Platte reinbringen:

    Code
    raidhotadd /dev/md1 /dev/sda2


    Dann startet der Resync Lauf und das Arrays laeuft wieder sauber. Jetzt kannst Du das fsck ueber /dev/md1 losjagen!


    Mit mdadm geht das wohl so aehnlich, siehe hier

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Hmmm das sieht mal nicht gut aus :(


    Naja ich wuerde das raid platt machen
    die platten mit spinrite checken
    neu aufsetzen
    offsite backup einspielen


    feddich


    gut das spinrite dauert etwas, aber danach weisst du das die platten noch ok sind.


    einziger problematischer punkt koennte das eventuell fehlende offsite ( usb platte etc. ) backup sein.


    offsite backup immer pruefen vor dem platt machen der festplatten !


    so long , ich drueck dir die Daumen dass es wieder wird ....


    Fab

    Debian server [ AMD Athlon(tm) 64 Processor 3000+ 3*Nova SE2 1* FF muss nachschauen CI + alphacrypt Soft raid5 549G]
    Clients [2 * MVP mit vomp 1 * MacBook Pro VLC streaming 1 * VOMP for windows]

  • Zitat

    Original von netvista-fan
    Naja, grundsätzlich könnte es möglich sein...
    werden ja immer 3x daten und 1x parität gespeichert...


    Klar. Wenn eine Platte weg ist, sind entweder die Daten oder die Paritaetsinformationen da. Aber was, wenn zwei Platten weg sind, wie das hier der Fall ist?


    Die Hoffnung besteht darin, dass sich auf dem Dateisystem zum Zeitpunkt des Absturzes nicht soviel veraendert hatte, so dass man auch eine alte Platte reinbringen kann.

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Erstmal vielen Dank an alle für die schnelle Reaktion. Das beruhigt mich schon mal etwas.


    Hier noch ein paar Infos:



    Ich habe zwar noch ein Backup, aber da liegt nicht das Neueste und Wichtigste drauf :wand
    Jetzt warte ich noch auf ein paar Rückmeldungen bezüglich der letzten Info, mach mich noch etwas im Internet klug, und dann gehts los.


    Gruß


    PB

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Naja, die 2 Platten scheinen ja nicht ganz weg zu sein sondern nur fehler zu haben...
    Wenn die Fehler schön verteilt sind über das Raid ok, wenn sie grad an einer Stelle des Raids sind kann es unschön sein, was wohl der Fall ist wenn grade etwas geschrieben wurde und dann der Strom weg ist...


    Somit dürfte die eine oder andere Datei kaputt sein.

  • was mich hier stutzig macht ist :


    ===============================
    mdadm: No md superblock detected on /dev/sda2.
    mdadm: No md superblock detected on /dev/sdb2.
    ===============================


    eventuell hat es dir bei den platten "nur" die superbloecke zerdeppert ....


    letzte woche hatte ein kollege eine kaputte windoof platte da, an der war die FAT kaputt, und windoof hat davon doch glatt ne kopie angelegt :P platte geprueft ( spinrite ) patritions/ fa tabelle von der kopie geholt. ( war irgendwas sektor 6 nach sektor 1 kopieren tut hier aber nichts zur sache) Und schwups war fast alles wieder da.


    Schau doch mal ob es da irgendwo info gibt was mann macht wenn die superbloecke fort sind ....

    Debian server [ AMD Athlon(tm) 64 Processor 3000+ 3*Nova SE2 1* FF muss nachschauen CI + alphacrypt Soft raid5 549G]
    Clients [2 * MVP mit vomp 1 * MacBook Pro VLC streaming 1 * VOMP for windows]

  • Also in meinem raid5 array(3 platten) sind mir auch mal 2 platten gleichzeitig ausgestiegen, habs dann so gemacht wie knebb oben schon beschrieben und läuft bis heute noch einwandfrei, hab noch keine defekte datei entdeckt.

  • Das klingt alles sehr ermutigent, das was Ihr schreibt.


    Leider funktioniert dies Sache mit mdadm bis jetzt leider nicht. Sowohl auf der akuellen "rescuecd" als auch bei Ubuntu Hardy (8.04) gibt es keine raidtools, die doch sehr vielversprechend sind.


    Um es kurz zu machen: ICH HABE MEINE DATEN WIEDER! :alki


    Was habe ich gemacht: Bem Assembly wurden immer nur die zwei funktionierenden Partitionen zusammengebaut. Damit war das RAID5, das aus vier Partionen besteht, nicht lauffähig. Nachdem ich dann zu den zwei automatisch assemblierten noch die dritte Partition, die nur als "removed" gekennzeichnet war, mit --add usw, dazugenommen hatte, war das RAID5 mit drei Partionen wieder lauffähig.!!


    Als Live-CD habe ich Ubuntu Hardy Desktop genommen. mdadm musste noch mit "sudo apt-get install mdadm" nachinstalliert werden. Da ich über dem RAID5 noch ein LVM laufen hatte, musste ich "lvm2" auch noch installieren.


    Das hat mir bei LVM weitergeholfen: http://linuxblog.uni-duesseldorf.de/335


    Der super-block wird von den raid-tools nicht unterstützt. In diesem steht drin, zu welchem RAID ein Device gehört. Bei den raid-tools musste das in der Datei /etc/raidtab stehen.


    Die Laufwerksbezeichnungen haben sich beim Betrieb unter der Live-CD etwas geändert:
    Aus /dev/sda wurde /dev/sdb usw. Jetzt sieht die Sache so aus:


    Mir ist, ehrlich gesagt, jedoch schleierhaft, weshalb die Superblöcke, die vorher bei zwei Partitionen gefehlt haben, wieder da sind. Insbesondere bei der Partition, die als "faulty removed" deklariert ist.


    Ich habe noch nicht viel geschaut, konnte aber bis jetzt keinen Datenverlust feststellen.


    Meine wichtigen Dateien werde ich erstmal auf eine andere Platte "backuppen" bevor ich weitermache. Ich möchte dann die als "faulty removed" bezeichnete Partition wieder einbinden und dann einen Neustart ohne Live-CD wagen.


    PB

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Yohoo!


    Dann gib doch als Referenz einfach den vollstaendigen Befehl mal hier an.


    Wahrscheinlich war der Superblock wg. dem "Reset" nicht geschrieben worden.


    Naja, schoen das alles wieder da ist.

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • OK, ich hab's noch gefunden:



    Achtung! Man beachte das -f in der nächsten Zeile im Vergleich zur ersten Zeile:


    Auf den letzten Befehl mit der Option -f (force) hatte knebb schon hingewiesen. Das hat nur nicht funktioniert (System mit Live-CD "systemrescue"). Warum nicht? Keine Ahnung.
    Vielleicht muss man zuerst mdadm ohne "-f" ausführen. Und dan nochmal mit der Option "-f". Oder liegt es am Kernel? Ubuntu 2.6.18, systemrescue 2.6.25 (http://www.sysresccd.org/Main_Page)



    Jetzt mal was generelles:


    Was macht man, wenn beim Runterfahren der Rechner hängen bleibt?
    - Warten? - Wie viele Minuten, Stunden? - Power-Reset mit möglichen Folgen?


    Ist bei einem Power-Reset ein System mit Hardware-RAID ebenso anfällig wie eins mit SW-RAID?


    Macht eine Rechner mit RAID nur dann Sinn, wenn man auch ein UPS hat, damit das RAID sauber herunter gefahren werden kann, wenn mal die Sicherung rausfliegen sollte??


    Gruß


    PB

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Zitat

    Original von pbriesch
    Achtung! Man beachte das -f in der nächsten Zeile im Vergleich zur ersten Zeile:


    Super. Jetzt weiss ich dann auch, wie es mit den neueren mdadm funktioniert. :)
    Inzwischen habe ich hier nur noch ein SW-Raid1 laufen. Da passiert sowas nicht.


    Zitat

    Was macht man, wenn beim Runterfahren der Rechner hängen bleibt?


    Warten. Wenn nach ca. 5 Minuten wirklich nix mehr passiert (also keine Plattenaktivitaet oder so), nochmal mit mehreren Ctrl-Alt-Del probieren. Hilft vermutlich nix, Reset druecken oder ausschalten- was willst Du sonst machen?

    Zitat


    Ist bei einem Power-Reset ein System mit Hardware-RAID ebenso anfällig wie eins mit SW-RAID?


    Tja, ich sag's mal so: Normalerweise nicht. Wenn Du dagegen den Strom wirklich ausschaltest, koennte das vorkommen. Allerdings sind nach meiner Erfahrung die RAID-BIOS wesentlich stabiler als das SW RAID. Da sollte also nix passieren. Und wenn die Kiste einfach haengt, passiert ja schreibend nix mehr auf der Platte, dann sollten die Daten auch problemlos da sein. In Deinem Fall wurde wohl nur der Superblock nicht korrekt geschrieben, die anderen Daten waren ja wohl noch da.
    Von daher ist so eine Aktion immer erst mal ein Riesenschreck. Im Endeffekt ist es aber harmlos.


    Zitat

    Macht eine Rechner mit RAID nur dann Sinn, wenn man auch ein UPS hat, damit das RAID sauber herunter gefahren werden kann, wenn mal die Sicherung rausfliegen sollte??


    Wovor soll eine USV schuetzen, wenn der Rechner beim Runterfahren haengt? Aber so wie Du fragst, kann die Antwort ja nur lauten: JA! :D
    Knebb, der alles mit USV abgesichert hat. :)

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • OK,


    "Knebb, der alles mit USV abgesichert hat"


    dann spar ich mir den 3ware-Controller und kauf mir ein USV.
    Hast Du da ein paar Tipps?


    Gruß


    PB


    P.S. Und das LVM spar ich mir dann auch. Für meine Zwecke komplizierte es die Datenrettung.

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Zitat

    Original von pbriesch
    dann spar ich mir den 3ware-Controller und kauf mir ein USV.
    Hast Du da ein paar Tipps?


    Eine, die Du mit einem entsprechenden daemon innerhalb Deines Systems abfragen kannst. Was nutzt Dir die USV, wenn die Sicherung rausfliegst, waehrend Du nicht zu Hause bist? Dann ist nach zwanzig Minuten Schicht im Schacht. Das ist dann genauso wie Stecker ziehen.


    APC ist klar Marktfuehrer, unter Linux gibt es den apcupsd, der genau das erledigt. Musst aber genau gucken, mit welchen USV der daemon kompatibel ist.


    [quoet]P.S. Und das LVM spar ich mir dann auch. Für meine Zwecke komplizierte es die Datenrettung.[/quote]
    Hae? Naja, wenn Du meinst. Es ist zwar in der Tat eine Ebene mehr- aber wenn man die Ebene darunter erst mal wieder hinbekommen muss, stoert das ja auch nicht. Ich auf meinen Fall verzichte da nicht mehr drauf. Dafuer brauche ich die Flexibilitaet, die mich von der physikalischen Festplatte unabhaengig macht. Und bei RedHat Enterprise Linux ist inzwischen dir /-Partition standardmaessig auf LVM.

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Hab noch was vergessen:


    knebb: "Inzwischen habe ich hier nur noch ein SW-Raid1 laufen."


    Jetzt, wo die Platten so billig sind, macht RAID 1 eigentlich mehr Sinn als RAID 5.


    Auch wäre interessant, nicht wie im RAID 1 die erste Platte kontinuierlich zu spiegeln, sondern in gewissen zeitlichen Abständen (z. B. jede Stunde) ein "Spiegelbild" auf die zweite Platte zu ziehen.
    Dann hat man eine Stunde Zeit, Änderungen and der ersten Platte wieder Rückgängig zu machen. Im Durchschnitt sind Daten, die nicht älter als eine halbe Stunde sind, gespiegelt.
    High-Availabilty brauche ich nicht. Eher etwas, was vor Plattencrash und vor Allem vor Bedienfehler schützt. (Das hört sich jetzt fast wie Apple's Time Machine an.)


    Gibt es da Lösungen für Linux (Programme, Backup-Scripte)?


    Gruß


    PB

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Zitat

    Original von pbriesch
    Auch wäre interessant, nicht wie im RAID 1 die erste Platte kontinuierlich zu spiegeln, sondern in gewissen zeitlichen Abständen (z. B. jede Stunde) ein "Spiegelbild" auf die zweite Platte zu ziehen.
    Dann hat man eine Stunde Zeit, Änderungen and der ersten Platte wieder Rückgängig zu machen. Im Durchschnitt sind Daten, die nicht älter als eine halbe Stunde sind, gespiegelt.
    High-Availabilty brauche ich nicht. Eher etwas, was vor Plattencrash und vor Allem vor Bedienfehler schützt. (Das hört sich jetzt fast wie Apple's Time Machine an.)


    Gibt es da Lösungen für Linux (Programme, Backup-Scripte)?


    rsync ist Dein Freund. Und mit einem Cron-Job läßt sich das leicht im gewünschten Intervall erledigen.


    CU
    Oliver

  • Zitat

    Original von UFO
    rsync ist Dein Freund. Und mit einem Cron-Job läßt sich das leicht im gewünschten Intervall erledigen.


    Sm besten eignet sich rsnapshot.
    Dann hat man gleich mehrere Versionen als Backup auf der Platte, verbraucht aber dennoch nur soviel wie inkrementelles Backup.

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Zitat

    Original von knebb
    Sm besten eignet sich rsnapshot.
    Dann hat man gleich mehrere Versionen als Backup auf der Platte, verbraucht aber dennoch nur soviel wie inkrementelles Backup.


    Danke für den Link, sowas habe ich schon immer gesucht.

    SAT Hardware: Gibertini SE75 | DuraSat Dur-Line UK-24 | DD OctopusNET V2 Rack (Firmware 1.1.6) mit MaxS8
    Server: Asus M5A78L-M/USB3 | Sempron 145@2Cores | 8GB ECC RAM | PicoPSU | Debian Stretch 64Bit | VDR 2.4.5 mit SAT>IP, epgsearch, live, markad
    Clients: RaspberryPI 2/3 | Yocto Poky Linux (Openembedded) 3.2+git | Linux Kernel 5.4.72 | VDR 2.4.5 mit SAT>IP, RpiHDDevice, SkinDesigner, Remote, Extrecmenu, Femon, Mlist


    R.I.P: Gigaset M740 mit VDR von open7x0.org

  • rsync und rsnapshot sind sehr interressant.


    Ich möchte aber folgendes machen:


    1. HD --> sda
    2. HD --> sdb (baugleich zur 1. HD)


    Jetzt wird jede Stunde sda auf sdb geklont (dd ist wohl der Befehl dafür).


    Jetzt passierts:
    Grub oder lilo werden falsch benutzt. Die Kiste bootet nicht mehr.
    Auf sdb ist die geklonte sda.
    Ich starte den Rechner neu, wähle aber im Bootmenü sdb als Bootplatte aus.
    Und schon ist alles, wie es vorher mal war.


    Die Frage, die sich mir nun stellt, ist folgende:
    Um einen Klon zum Zeitpunkt t = 0 auf sdb zu erstellen, darf sich sda nicht mehr verändern, bis das Klonen fertig ist. Keine Programme dürfen während dieser Zeit schreibend zugreifen.


    Wie macht man das?


    Gruß


    PB

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!