[HELP] RAID 5 kaputt??

  • Hi zusammen,



    beim routinemäßigen Auswerten meiner Log-EMails bin ich über eine Unregelmäßigkeit bei meinem Video-Server gestolpert.
    Dort zeigt nämlich cat /proc/mdstat an, das anscheinen eine Platte nicht mehr im RAID-Verbund ist. (Disk 3/4 - [_UUU])
    Jetzt meine Frage:
    Was kann ich machen, um die betroffene Platte zu testen?
    Vom Controller wird sie noch ganz normal erkannt. Mit hdparm kann ich auch noch auf die "defekte" Platte zugreifen und der RAID-Verbund gibt auch noch brav seine Daten Preis.


    Was kann ich jetzt tun???


    Gruß
    Boris

  • Hallo


    Ich würde so vorgehen:


    1. Rauskriegen,welche Partitionsich aus dem Raid verabschiedet hat.
    entweder über cat/proc/mdstat oder über cat /etc/fstab


    2. prüfen ob die Partition die gleiche Partionsdaten wie die anderem im Raid hat


    3. Die Partition (sofern sie in Ordnung ist) mit "raidhotadd" wieder zu dem Raid hinzufügen


    Wenn alles gklappt hat, wirst Du sehen, dass das Raid wieder einen 'Resync' ausführt.


    Gruß


    Gehlhajot

    VDR-1: streamdev-server | Hummingboard2| TT 3600 USB | Siemens S500 Gehäuse | Archlinux mit eigen Skripten
    VDR-2: streamdev-client | rpihddevice | Raspberry 2b | Siemens S450 Gehäuse| Remote: URC6410 | LG 42LV4500 |
    Archlinux mit eigenen Skripten


  • Hi gehlhajo,


    Danke für deine Antwort!


    Die betroffene Disk hat folgende Partitionsdaten:

    Code
    Gerät Boot      Start         End      Blocks   Id  System
    /dev/hde1               1       19456   156280288+  fd  Linux raid autodetect


    Das sind die gleichen Daten wie bei den anderen Disks.


    Ich habe aml noch in /var/log/boot.msg reingeschaut: da steht folgendes:

    Code
    md: running: <hdk1><hdi1><hdg1><hde1>
    <4>md: kicking non-fresh hde1 from array!
    <6>md: unbind<hde1>
    <6>md: export_rdev(hde1)


    Was bedeutet das? Kann ich da einfach das "raidhotadd" machen? Will nämlich nix zerstören!!!


    Gruß
    Boris

  • Offensichtlich ist das System einmal nicht korrekt runtergefahren und hat dabei die Superblockinfos nicht korrekt geschrieben.


    Ein raidhotadd /dev/hde1 /dev/mdX dürfte das Problem beheben. Danach sollte er wieder syncen (cat /proc/mdstat). Wenn es allerdings öfters vorkommt, würde ich mir die HDD einmal genauer anschauen.

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Hi knebb,



    Danke für Deine Antwort!
    Habe jetzt das raidhotadd gestartet.
    cat /proc/mdstat Sagt mir folgendes:

    Code
    Personalities : [raid5]
    md0 : active raid5 hde1[4] hdk1[3] hdi1[2] hdg1[1]
          468839424 blocks level 5, 512k chunk, algorithm 2 [4/3] [_UUU]
          [>....................]  recovery =  0.1% (198784/156279808) finish=274.7min speed=9465K/sec
    unused devices: <none>


    Werde die Platte in Zukunft genauer im Auge behalten!



    Vielen Dank und Gruß
    Boris

  • FUCK!


    Ich glaube die Disk ist defekt???!!!???


    Zuerst habe ich n mdstat reingeschaut und dann das festgestellt:

    Code
    Personalities : [raid5]
    md0 : active raid5 hde1[4](F) hdk1[3] hdi1[2] hdg1[1]
          468839424 blocks level 5, 512k chunk, algorithm 2 [4/3] [_UUU]
    
    
    unused devices: <none>


    Danach war in /var/log/messages folgendes zu sehen:


    Kann man das als Ende meiner Platte sehen??


    Boris

  • Hi Eichbaum!


    Die Chancen stehen schlecht für Deine Platte. Ich würde das Tool vom Plattenhersteller benutzen und die Platte einem genauen Test unterziehen.


    Wenn es nur ein paar defekte Sektoren sind, können die evtl. umgemappt werden und die Platte ist wieder in Ordnung. Wenn nicht, hast Du erst mit einem negativen Test des Tools i.d.R. die Chance, die evtl. bestehende Garantie in Anspruch zu nehmen.


    Auf jeden Fall hat Dir Dein Raid wohl das Überleben der Daten ermöglicht! Ohne Raid wäre jetzt möglicherweise wichtiges verloren gegangen...


    Wenn die Platte wieder funktionieren sollte, würde ich sie auch genau im Auge behalten!


    Tschau
    Tueftler17

  • Hii


    Prüfe auch mal die Kabel (hat bei mir mal ein Raid zerschossen)
    Ansonsten besorg die doch ein Diagnose-Tool für Deine Festplatte
    und teste sie mal. Jeder HD-Hersteller bietet eigentlich für seine Platten so ein Tool an.
    Aber Du solltest bald eine Kopie der auf Deinem Raid befindlichen Daten machen.Noch eine Platte kaputt und die Danne sind futsch...


    Gruß


    gehlhajo

    VDR-1: streamdev-server | Hummingboard2| TT 3600 USB | Siemens S500 Gehäuse | Archlinux mit eigen Skripten
    VDR-2: streamdev-client | rpihddevice | Raspberry 2b | Siemens S450 Gehäuse| Remote: URC6410 | LG 42LV4500 |
    Archlinux mit eigenen Skripten


  • Zitat

    Original von Eichbaum
    Kann man das als Ende meiner Platte sehen??


    Hattest Du vorher was am System geändert? Ein andere Platte eingehängt? Eine zusätzliche Karte eingebaut? Nein? Dann ist die Platte wohl hinüber. Sind die anderen Platten aus der gleichen Serie? Dann würde ich alsbald neue Platten holen!

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Hallo zusammen,



    Danke für Eure Antworten!


    Die Platten im Raid sind alle 160er Samsung - davon 2 neuere SATA und zwei P-ATA, eine davon auch schon ein bißchen älter. Wenns die ist (sehe ich erst, wenn ich sie ausgebaut habe) dann ist die Garantie wohl schon ne weile abgelaufen.


    Am der Systemconfiguration hab ich nichst geändert - der Server ist zwar in ein neues Gehäuse umgezogen, die PCI karten sind jedoch noch im gleichen Slot und die Festplattenkabel habe ich beim Umbau erst gar nicht vom SATA-Controller abgezogen. Das sie richtig sitzen, hab ich natürlich auch geschaut. Das ganze lief ja auch ohne probleme.


    Werd den Server jetzt jedenfalls auslassen und die Platte in nem anderen Rechner mal checken!



    Viele Grüße
    Boris

  • Du solltest unbedingt versuchen ein anderes und NEUES kabel zu verwenden.
    Ich hab schon aufgehört zu zählen wie viele PATA Kabel mir schon verreckt sind...
    Aber Klopf, klopf, klopf auf Holz SATA Kabel scheinen echt robust zu sein.

  • So,



    habe Gestern eine neue Platte eingebaut, resync angestoßen, 4,5 Stunden gewartet und war dann froh, das alle Daten wieder da waren!!!


    :welle :welle :welle



    Viele Grüße
    Boris



    PS: Man weiß ein RAID erst wirklich zu schätzen, wenn eine Platte davon ausfällt!

  • Zitat

    Original von Eichbaum
    PS: Man weiß ein RAID erst wirklich zu schätzen, wenn eine Platte davon ausfällt!


    Vorher glaubt es mir auch keiner. 8o

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!