Western Digital Festplatten gemeuchelt mit hdparm wegen unvollständiger SATA-Implementation

  • Moin zusammen,
    hier eine dringende Warnung an alle VDR-User, die WD-Festplatten verbaut haben und mit den Energiespar-Features spielen: Um bei einem großen RAID den Leistungsbedarf zu reduzieren, wollte ich versuchsweise mal den Idle-Timer setzen, habe versehentlich aber mit

    Code
    hdparm -s 10 <device>

    (entscheidend ist nur Wert>0) die Platte auf "powerup_in_standby" konfiguriert. Nun machte das aber an dem Controller Probleme - und das Schlimme daran ist, daß die Platte sich beharrlich weigert, das Feature wieder abzuschalten. Ein Anruf bei der Hotline hat ergeben, daß das nicht möglich sei (Problemfälle wären mit Kunden des "RocketRaid" von HiPoint bekannt, wo man, wie ich gelesen habe, das Feature ebenfalls per Software aktivieren kann), die Platten sind reif für 'nen Austausch. Das Problem ist bei WD bekannt und betroffene Platten werden halt ausgetauscht, eine korrigierte Firmware die das An- UND Abschalten unterschützt werde es aber nicht geben. Besonders gemein ist das insofern, als das

    Code
    hdparm -S <Wert> <device>

    die Spindown-Idletime setzt, was harmlos ist, bei der WD10EACS aber auch keine Wirkung zeigt...


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

    Edited 2 times, last by torsten lang ().

  • Hi,


    Bei RAID macht man auch kein Standby oder der Gleichen. Habe da vor kurzem mal nen ganz interessanten Thread gelesen. Wenn ich ihn finde, dann reiche ich in nach. Dein beschriebenes Problem ist natürlich ganz anderer Natur.


    Gruß, Heinzelrumpel

  • Quote

    Original von heinzelrumpel
    Hi,


    Bei RAID macht man auch kein Standby oder der Gleichen. ...


    Gruß, Heinzelrumpel

    Moin moin,
    das stimmt so nur bedingt. Es gibt verschiedene Modi, und was bei meinen Tests (wenn ich mich jetzt richtig erinnere) zu keinerlei Fehlermeldungen und Problemen geführt hatte, war

    Code
    sdparm -C stop <device>

    oder so ähnlich, die Leistungsaufnahme sank dabei auch entsprechend um mind. 12W. Die Platten hatten gestanden, die Verbindung zum Controller war aber OK, und bei der ersten Anforderung fuhren die Platten auch wieder hoch. Genau, was ich von einem Energiespar-Server erwarte. Da ich im Vollausbau an die 10 3,5"-Platten haben werde, spielt es schon eine Rolle, ob die einzelne Platte beim Nichtstun ca. 1W, rd. 4W (idle, WD10EACS) oder rd. 10W (div. andere Hersteller) braucht. Ziel war es letztlich, mittels subfs o. ä. dafür zu sorgen, das das Filesystem auf dem/den RAID(s) nicht permanent gemountet bleibt. Da ist noch ein wenig Forschungsarbiet zu leisten.


    Aber ich schweife ab - ich finde es einfach erschreckend, daß sich aktuelle Platten so einfach mittels offizieller, dokumentierter Kommandos ins Nirvana schicken lassen. Ich hatte ja schon Bauchschmerzen genug mit den vielen Berichten über 750GB und 1TB Platten (und nicht nur WD), die nach einmal Windows installieren nur noch 32MB Kapazität hatten (angeblich durch BIOS-Fehler bestimmter Boards), z. T. auch unwiderruflich.


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

    Edited once, last by torsten lang ().

  • Hi,


    was served denn der Server, wenn ich mal fragen darf?
    Mit dem Verbrauch hast Du natürlich recht. Ich mache es mit meinem Heimserver ähnlich, nur nicht im RAID.


    Gruß, Heinzelrumpel

  • Quote

    Original von heinzelrumpel
    Hi,


    was served denn der Server, wenn ich mal fragen darf?
    ...


    Gruß, Heinzelrumpel

    Ist zwar off topic, aber trotzdem klar doch: Der Neue soll meine bisherige Maschine für Web, EMail, Bilder, sonstige Datensammlungen etc. ersetzen (der Alte ist nicht 100%ig zuverlässig und frißt trotz Pentium M via Adapter deutlich über 100W, was wohl hauptsächlich dem gefräßigen ASUS-Board geschuldet ist - in dieser Beziehung hat ASUS ja einen ziemlich schlechten Ruf). Nachdem mir mehrfach wegen Schlampigkeiten bei verschiedenen Providern meine Webpräsenz gelöscht wurde und das immer mit einigem Zeitaufwand für das Rücksichern verbunden war, insbesondere bis alle Skripte etc. wieder liefen, lagert auch meine Internet-Präsenz dort und wird von außen via einer Umleitung auf DynDns angesprochen.


    Neu hinzukommen wird jetzt noch das Videolager, und da sind wir halt mittlerweile in der Multi-TB-Region. Bisher habe ich mittels VDR viele DVDs gemastert, aber das Ganze ist einfach nicht mehr gescheit zu handhaben und der Zeitaufwand zu groß. Der nächste Schritt wird also sein, die VDR-Aufnahmen direkt auf dem Server zu lagern (statt auf DVD und SDLT-Bändern).


    Als Basis für das Vorhaben habe ich mir daher ein möglichst sparsames ASRock Board gesucht und tatsächlich noch einen 35W Dual Core Athlon64 aufgetan (im Moment ist noch ein 65W Typ verbaut). Zwei Notebook-Platten dienen als System- und Datenspeicher (im RAID1 Verbund) für häufig veränderliche Daten oder Daten, die jederzeit verfügbar sein müssen (sprich Webserver, EMail-Server etc.). Die großen 1TB-Platten laufen via Port Multiplier an einem PCIe SATA Controller in einem RAID5 Verbund. Diese sollen später als Lager für Digital-Fotos und Video-Aufzeichnungen dienen. Und genau dieser Verbund ruht die meiste Zeit und soll dann auch abgeschaltet werden.


    Damit verfügen alle Datenträger über Redundanz, weiterhin wird es für die wichtigen Bereiche (Webserver, EMail, Fotos) noch eine einfache Backup-Lösung geben (da ist die endgültige Lösung aber ncoh nicht ganz klar).


    Ich denke, mit der Konfiguration bin ich schon auf dem richtigen Weg. Wenn halt nur diese blöde Panne mit den Platten nicht passiert wäre (dann könnte ich jetzt erste Performance und Verbrauchstests machen)...


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

    Edited once, last by torsten lang ().

  • Moin,
    kannst Du dazu mal ein wenig mehr erzählen? Eigentlich sollten die SATA Platten sich ja per Timer nach einer gewissen Zeit selbst abschalten können, aber bei meinen WDs hat das nicht gefunzt (wohlgemerkt, gemountet war das betreffende RAID nicht, es war ja noch nicht mal ein Dateisystem drauf). Oder benutzt Du da was Anderes (bei meinen Recherchen fiel auch mal der Begriff "scsi_idle", wohl irgendein Daemon, aber das habe ich noch nicht weiter verfolgt).


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

  • Hi,
    nö, ich mach einfach auf das gemountete Raid ein

    Code
    hdparm -S 241 /dev/sda
    hdparm -S 241 /dev/sdb
    hdparm -S 241 /dev/sdc
    hdparm -S 241 /dev/sdd


    Bisher habe ich, entgegen einiger entgegensprechender Meinungen, überhaup keine Probleme.


    Aber ich bin natürlich auch an Infos interessiert wie man das "besser" machen kann (z.B. standby, wenn das wirklich mehr Strom spart)


    Gruß
    Stefan

  • hi,


    also bei mir läuft der standby (und auch das "einschalten") mit den platten. Allerdings kommen die anscheinend nicht mit zu kurzen Zeiten klar. Bisher kürzester Zeitraum für standby waren 12 minuten obwohl 5 eingestellt war und nichts auf die platte zugegriffen hat!


    Thread damals


    Gruss Lexi

  • Hmmm,
    ich hab's mit einer meiner WD10EACS gerade nochmal probiert - geht einfach gar nicht. Platte mit

    Code
    hdparm -S 60

    (mit großem "S") konfiguriert (wie gesagt "s" ist der "staggered spinup", nicht die Idle Zeit), die Platte läuft nach 1,5h immer noch ("active/idle). Bei meiner Seagate hat's dagegen funktioniert.


    Ich glaube, ich storniere die WD-Platten-Bestellung wieder und nehme doch die Seagates, auch wenn sie im Betrieb mehr brauchen, wenn bei den WD der Idle-Timer nicht geht (mal abgesehen von dem anderen Problem)...


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

  • Entschuldige, ich hätte bereits Anfang Januar davor warnen können! Mir ist das gleiche passiert, statt "-S" habe ich "-s" verwendet. Die Platte (320 GB, JS) ist dann nur noch mit dem Tool von WD hochgefahren. Wenn ich dann den Computer resettet habe, ohne ihn auszuschalten, konnte ich von der Platte booten und meine Daten sichern.


    Die Austauschplatte die ich dann bekommen habe ist aber ein Witz! Richtig LAUT und hört sich einfach ungesund an. Auf die Platte packe ich nur noch unwichtige Daten, in ein USB-Gehäuse!


    Der Austausch selber lief ziemlich gut!


    Gruß
    Bernhard

  • Hallo,
    also, obwohl die Seagate-Platten was den Energieverbrauch und die Spitzenströme beim Starten angeht wesentlich schlechter dastehen als die WDs habe ich meine Bestellung storniert und auf Seagate umgestellt (hatte auch in der Vergangenheit nie Ärger mit Seagate, zumindest bei allen neueren PATA/SATA Platten so ab 160GB). Die 10 Platten lagen dann netto knapp über 8TB, so daß ich nochmal splitten mußte (225GB/7.98TB), da sonst ext3 nicht möglich gewesen wäre. Gestern abend hatte ich den Build-Lauf gestartet und die Filesysteme angelegt, heute abend konnte ich mal testen:


    • Die Platten des gemounteten Filesystems schalten ich wie gewünscht ab (hab' ebenfalls 'ne halbe Stunde eingestellt).
    • Die Leistungsaufnahme sinkt pro Platte um ca. 10W im Standby (in der Summe ist das dann auch nur rd. 1W mehr als bei den WDs im Standby).
    • Das Anlaufen klappt ohne Probleme, klingt aber (weil alle gleichzeitig starten) schon beängstigend.


    Meine Raidsonic Backplanes sind übrigens per Pin11 auf dem SATA Power-Stecker fest auf "Staggered Spinup" konfiguriert, was die WDs komplett ignoriert hatten. Die Seagate Platten fahren daher ebenfalls erst nach Aufforderung durch den Kernel hoch, was leider viel Zeit beim Booten kostet (wird sequentiell bearbeitet). Vielleicht löte ich das in den Rahmen mal um, wenn es überhaupt geht (Pin 11 ist nämlich gleichzeitig auch der LED-Anschluß, d. h. man braucht wohl Elektronik, um beim Powerup den Pin auf Masse zu ziehen und später das LED-Signal daraus zu entnehmen).


    Lesen geht mit ca. 150MB/s und schreiben mit ca. 115MB/s. Für Soft-RAID und einen Single-Lane PCIe SATA Controller (die 2,5GBit/s einer PCIe-Lane sind hier der Flaschenhals, während die beiden Ports zu den Multipliern ja schon mit je 3GBit/s laufen) denke ich ist das OK (Multilane hätte es von Silicon Image nur mit Bridge auf einen PCI-X Chip gegeben, die Leistungsaufnahme wäre dann gleich wieder viel höher gewesen). Und abgesehen davon reicht's für meine Anwendung allemal...


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

    Edited 3 times, last by torsten lang ().

  • Hallo zusammen,
    um den alten Thread nochmal herauszukramen: Nach knapp drei Jahren Dauerbetrieb kann ich Folgendes sagen:


    Ich habe den ersten Controller gegen einen mit Marvell Chipsatz ausgetauscht (Adaptec 1430SA - leider unterstützt dessen BIOS aber keine Port Multiplier), da die Silicon Image Chips sich nicht sonderlich mit dem NVidia Chipsatz des Mainboards vertragen haben. Der Datendurchsatz ist dann auf 350..400MB/s gestiegen.


    Die Seagate 1TB Platten haben leider andere Firmware Fehler. Der bekannteste ist der mit dem fehlerhaft formatierten Log, der zum Totalausfall der Platten führen kann. Daher mußte auf sämtlichen Platten die Firmware aktualisiert werden. Ein weiteres Problem ist, daß die Firmware der Platten nicht absturzsicher ist. Im 24/7 Betrieb kommt es im Schnitt alle ein bis zwei Monate vor, daß eine Platte abstürzt und nicht mehr ansprechbar ist (die WD Notebook-Platten fürs System machen diese Zicken nicht); evtl. hängt das mit dem Einsatz eines SMART Daemon zusammen, vorher hatte ich m. W. diese Probleme nicht. Außerdem funktioniert auch bei diesen Platten der Spindown-Timer nicht richtig - die Platten können in einen Zustand kommen, wo die Firmware behauptet, die Platte wäre geparkt, tatsächlich laufen die Scheiben aber noch.


    Lästig sind die im Kernel vorhandenen Fehler im SATA-Bereich bezüglich Port Multipliern - der Staggered Spinup (bzw. Powerup In Standby) macht Probleme. Ganz aktuelle Kernel habe ich allerdings nicht getestet, da das System sonst grundsätzlich läuft.


    Am ärgerlichsten sind allerdings Probleme, die in Zusammenhang mit der oft minderwertigen Qualität der (durchaus nicht billig) eingekauften Komponenten stehen, und das an Stellen, wo man es eigentlich nicht erwartet:

    • Mittlerweile mußte ich mehrere SATA Kabel tauschen, weil nach einiger Zeit Probleme mit der Übertragungsqualität aufgetreten waren. Einige flutschneue Kabel aus der Box eines der teuersten ASUS-Boards, das ich habe, konnte ich gleich entsorgen, weil sie überhaupt nicht funktionierten.
    • Beim Mainboard kam es nach längerem Betrieb plötzlich vor, daß einzelne SATA-Anschlüsse ausfielen (bis zum Reboot). Zugegeben, das Board war eine der wenigen Billig-Komponenten, aber primär, weil es eines der sparsamsten war.
    • Die SATA-Backplanes zicken manchmal bei der Erkennung der Lüfterfunktion und geben falschen Alarm. Das Schlimme ist, daß die Backplanes dann den SATA-Betrieb stören, jeweils ein Slot wird dann im Sekundentakt resettet, was natürlich den RAID-Betrieb stört.

    Die Behauptung, RAID und Standby-Mode der Platten vertrügen sich nicht, trifft jedenfalls nicht zu - warum sollte sie auch? Die Platte wird ja nicht hart abgeschaltet, lediglich der Plattenstapel wird gestoppt. Möglich, daß es bei dem tiefsten Powerdown-Modus anders aussieht.


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

    Edited once, last by torsten lang ().

  • Hallo zusammen,
    [*]Mittlerweile mußte ich mehrere SATA Kabel tauschen, weil nach einiger Zeit Probleme mit der Übertragungsqualität aufgetreten waren. Einige flutschneue Kabel aus der Box eines der teuersten ASUS-Boards, das ich habe, konnte ich gleich entsorgen, weil sie überhaupt nicht funktionierten.[*]Beim Mainboard kam es nach längerem Betrieb plötzlich vor, daß einzelne SATA-Anschlüsse ausfielen (bis zum Reboot). Zugegeben, das Board war eine der wenigen Billig-Komponenten, aber primär, weil es eines der sparsamsten war.[*]


    SATA Stecker und Buchsen sind manchmal minderwertig. Und das nicht nur auf dem Motherboard. Ich musste an einem Controller eine "Zugentlastung stricken" ansonsten resettete sich der ganze Controller ständig, oder einige Platten wurden nicht immer erkannt.


    Gruß Fr@nk

  • Hallo Frank,
    ich hab' mir mal Dein Projekt angeschaut. Hübsch. Bei den Steckern muß man zwei Varianten unterscheiden: Es gibt welche mit Metall-Feder, die in der Wanne der Buchse einrastet, und solche, die in einer Nut in dem "L" der Buchse einrasten. Letztere rasten bei allen Buchsen ein, die ersteren halten einfach nicht auf Buchsen ohne die Wanne.


    Ich habe bei mir aber schon nur zueinander kompatible Varianten verbaut. Wie gesagt, geholfen hat's trotzdem nichts, das Erschreckende ist, daß die Ausfallerscheinungen erst nach einiger Zeit aufgetreten sind, ich vermute mal, die Kontaktierung des Kabels mit dem Stecker läßt (durch Korrosion?) nach.


    Viele Grüße,
    Torsten

    "The day Microsoft makes something that doesn't suck is probably
    the day they start making vacuum cleaners" - Ernst Jan Plugge
    __________________
    Torsten Lang

  • Ich habe bei mir aber schon nur zueinander kompatible Varianten verbaut.


    bei dem Dawicontrol kam erschwerend hinzu, das die umlaufende Außenwanne vollständig fehlte, also nur die Innenlippe mit den Kontakten da war.


    .

    Quote

    Wie gesagt, geholfen hat's trotzdem nichts, das Erschreckende ist, daß die Ausfallerscheinungen erst nach einiger Zeit aufgetreten sind, ich vermute mal, die Kontaktierung des Kabels mit dem Stecker läßt (durch Korrosion?) nach.


    Eigentlich sind die Kontakte vergoldet, vielleicht Pfusch beim Beschichten.
    Ich habe aber beobachtet, das sich im Betrieb (vermutlich durch die Schwingungen der HDD, die sich auf die Kabel übertrugen) dann langsam die Stecker auf dem Dawicontrol etwas lösten. Ich musste bei Fehlern so alle paar Tage die Stecker wieder nachschieben. Mit dem Fixieren der Kabel ist das aber jetzt beseitigt.


    Gruß Fr@nk

  • bei dem Dawicontrol kam erschwerend hinzu, das die umlaufende Außenwanne vollständig fehlte, also nur die Innenlippe mit den Kontakten da war.

    Der Satz gefällt mir...
    Klingt irgendwie, um damit einen Lehrling am 1. April zu foppen.
    So nach dem Motto:
    Öl mal die umlaufende Außenwanne, damit die Innenlippe mit den Kontakten richtig einrastet :D

    Dr. Brömme grübelt:
    Acht Wochen, nachdem man ihm beim Kölner Straßenkarneval einen Gratiskorn angeboten hatte,
    dämmert ihm langsam, dass er einem hinterlistigen Alaafisten aufgesessen ist.

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!