S: Verteiltes Dateisystem via Netzwerk

  • Yohoo!

    Ich bin auf der Suche nach einem verteilten Dateisystem (oder aehnliches), dass mir die geschriebenen Daten repliziert.

    Also quasi RAID1, aber als zweites Device etwas beliebiges, auch via Netzwerk.

    Die Replikation darf auch gerne Offline passieren...

    Jemand einen Tip?

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • drbd
    => RAID1 ueber Netzwerk. Mal danach googgeln

    Das ist echtzeit

    Wenn Du nur ab und an Synchronisieren willst ist bei mir rsync die erste Wahl
    Ich mache so zusaetzlich einen Live Abzug auf ne USB Platte ( 1x am Tag )

    Ein "echtes" verteiltes Filesystem willst Du wahrscheinlich nicht wirklich kennenlernen

    Server PC leap42.3 ::: vdr-2.3.8 ::: DD Cine C2 + 1 Erweiterung headless

    zbox leap42.3 ::: vdr-2.3.8 + SatIP Plugin

    OctopusNet DVBC mit 4 Tunern

    Clients 2 x Raspberry 2 + libreElec 8.2.1 verbunden mit zbox

    Edited 2 times, last by asshep (August 25, 2009 at 10:56 PM).

  • Yohoo!

    Vom Anwendungsprofil ist rsync bei mir auch erste Wahl.

    Problem ist dabei aber, das das Source-Dateisystem massiv aus Hardlinks besteht.
    So braucht rsync damit unter massivem Speicherbedarf trotz nur kleiner Aenderungen knapp 24h zum Abgleich....faellt also aus.

    RAID1 in Echtzeit gefaellt mir nicht so gut, da sich dann auch Fehler replizieren...

    Hintergrund:

    Ich verwende hier einen Backupserver mit BackupPC. Jetzt will ich einfach noch das Dateisystem, auf dem die Daten gesichert werden, offline ziehen. Da das Archiv aber knapp500GB gross ist, ist es nicht sinnvoll, das jedes Mal komplett neu zu kopieren...rsync also eigentlich ganz gut ist.

    Was ist eigentlich suche, ist "rsync blockbasiert". Habe ich aber noch nicht gesehen....wobei: es wird unter Linux ja eigentlich alles als Datei behandelt. Hat jemand schonmal probiert, /dev/hda1 via rsync zu kopieren? Hmmmm....

    Christian, der das gleich mal probiert. Aber vmtl. scheitert....
    [EDIT]
    Jo, wie gedacht. Rsync kopiert sauber den Eintrag aus /dev, aber nicht den Inhalt. Auf der rsync Mailingliste gibt es einen entsprechenden Thread. Von 2005.....:-( Auf Sourceforge gibt es ein Projekt "rsyncfs" , bei dem die letzte Aktivitaet vor 1.128 Tagen war....

    Der Bedarf scheint da zu sein, es hat wohl noch keiner realisiert. Gibt es nicht hier ein paar Entwickler? ;)

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

    Edited once, last by knebb (August 25, 2009 at 11:12 PM).

  • als rsync ersatz: find + cpio via ssh

    beispiel:

    cd /home; ssh user@host l "cd /; find . -depth -print | cpio -oaV" | cpio -imVd
    "holt" die daten

    find path -depth -print | cpio -oaV | ssh user@host 'cpio -imVd'
    "schiebt" die daten

    edit: ach ja und richtiges verteiles fs: gluster, gpfs, cXFS, lustre (enterprise) etc.. :)

    gruss,
    -- randy

  • Quote

    Original von knebb
    Yohoo!

    Ich bin auf der Suche nach einem verteilten Dateisystem (oder aehnliches), dass mir die geschriebenen Daten repliziert.

    Also quasi RAID1, aber als zweites Device etwas beliebiges, auch via Netzwerk.

    Die Replikation darf auch gerne Offline passieren...

    Jemand einen Tip?

    OpenAFS, ist allerdings nicht ganz einfach aufzusetzen und eventuell overkill.

    Bye...

    Dirk

    Edited once, last by d.heinrichs (August 27, 2009 at 2:09 PM).

  • Hallo Knebb,

    die vielen Hardlinks entstehen doch vermutl. bei der Sicherung. Du brauchst also nur die immer neuen Verzeichnisse mit rsync abzugleichen. Dort kannst Du dann die jeweils vorhanden als Link-Quelle angeben, so das auf der 2. Sicherungsplatte "neue" Hardlinks erstellt werden.

    Das Script für die ganze Aktion dürfte nicht so schwer sein, es sollte ja auch ganz alte Sicherungen mit löschen.

    Hardy

    Suche: 6 Richtige für die nächste Lottoziehung
    PS: Wer Rechtschreibfehler findet, darf sie behalten!

  • Quote

    Das Script für die ganze Aktion dürfte nicht so schwer sein, es sollte ja auch ganz alte Sicherungen mit löschen.


    Das gibt es fertig als "rsnapshot". Ich nutze das als Backupscript. Die Intervalle und die Anzahl der pro Intervalltyp vogehaltenen Kopien kann man einstellen.

    -- Was zum Geier ist eine Signatur???

    Edited once, last by turboj (August 27, 2009 at 8:08 PM).

  • HFlor und turboj:

    Das bringt mir nichts. Ich will ja schliesslich das ganze Verzeichnis inkl. der entsprechenden Hardlinks kopieren. Wenn ich davon nur Teile abgleiche, werden die Hardlinks nicht mitgenommen. Bringt mir nichts.

    Und rsnapshot bringt mir auch nichts. Rsnapshot nutzt rsync als Transferprogramm. Aber rsync braucht aufgrund der riesigen Menge and Hardlinks ewig und drei Tage.

    Was ich halt suche, ist wirklich rsync blockbasiert. Gibt es aber wohl nicht. Also Dateisystemreplikation. Problem dabei ist aber, dass ich das lokale Dateisystem nicht ausbremsen moechte, nur weil das remote System max. 2Mbit Anbindung hat. Sollte also offline passieren.

    Noch jemand Ideen?

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • XtreemFS vielleicht? Gibt es sogar fertig für Debian, RPM und Windows.

    VDR-User #985

    SW: Debian Sid, e-Tobi's VDR 1.6.0, vdr-sxfe mit VDPAU :strike1
    Plugins: devstatus, director, dvd, extb, femon, graphlcd, lastfm, mp3, mplayer, osdpip, osdteletext, premiereepg, skinenigmang, streamdev-server, sysinfo, text2skin, tvonscreen, vcd, vdrrip, webvideo, xineliboutput
    HW: Silverstone LC17, P5Q SE, C2D E7300, 1GB RAM, 500GB Platte, Hauppauge DVB-S rev1.6, TT 3200

  • Quote

    Originally posted by kleini
    XtreemFS vielleicht? Gibt es sogar fertig für Debian, RPM und Windows.


    Bin gerade mal dabei, mir das anzuschauen, leider hat CentOS 5.3 (noch) keinen FUSE Support. :(

    Versuche es jetzt einfach mal testhalber auf einer Fedora 10 Installation (gut, wenn man virtualisiert hat ;))

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

    Edited once, last by knebb (September 4, 2009 at 8:26 AM).

  • ich bin echt erstaunt wie viele FS es für solche Zwecke gibt.
    Klingt alles ganz interessant.
    Nun überlege ich auch ob ich einen alten Rechner per ACPI aufwachen lasse um dort ein backup zu machen.
    Ist irgendwie sicherer als eine zweite Platte im selben Rechner. Und der Backup Rechner kann dann auch im Keller stehen.

    Da ich dann aber von mehrere Rechner ein Backup machen will, werde ich sicher nicht genug Platz haben um 1:1 Backups zu machen.
    Ausserdem ist es doof wenn man schon ein defektes FS sichert und nur eine Sicherung hat.
    Ich habe bis jetzt immer backup2l benutzt.
    Dabei dann zwei volle und 5 inkrementelle backups gemacht.
    Das ganze arbeitet mit tar.gz(oder anderen Archiven). Ein paar Sachen hatte ich sogar verschlüsselt mal extern gesichert.
    Damit habe ich aber nie ein ganzes System gesichert. Immer nur /etc/ /home/ mysql usw.
    Neu aufsetzen dauert also mehr als 5 min.

    Bei welchem der genannten FS gibt es denn Kompression?
    Da ich im embedded Bereich arbeite finde ich als Kompression LZMA richtig super. Schaft bei uns ca 1/7 ist aber leider readonly.

    Meine VDRs

    VDR Server: Ubuntu Lucid Lynx mit 6TB im RAID und quadtuner DVB-S2
    VDR Client1: Raspbian @ Raspberry Pi 2
    VDR Client2: Ubuntu @ Laptop
    VDR Client3: MDL @ Raspberry Pi
    VDR Client4: zen2vdr @ SMT-7020s (wird zZ nicht benutzt)
    VDR Client5: Android @ HP Touchpad mit VDR Manager App


    [Blocked Image: http://decembersoul.dd-dns.de/~patrick/signatur_vdr.php]

  • Wie ist es mit DRBD und snapshot device?
    Hab allerdings keine info über geschwindigkeit und auslastung.


    Gruss
    Ralf

    ## VDR-1 ## Easy-VDR 0.6,SilverStone LC 11, Aopen S661FXm-FSN, Intel Celeron M 1,5GHz, 512MB, Technotrend 2300s, ARTIC IR-Einschalter
    ## VDR-2 ## EasyVDR 0.6, CoolerMaster CM-Media, ASUS M2NPV-VM, Athlon 3200, 2GB RAM,4GB CF-Card, 500GB HDD, Nexus-S 2.3 full TS patch, ARTIC IR-Einschalter
    ## SMT7020s ## zen2vdr noch alles original

    Wenn man immer tut, was man schon kann, bleibt man immer, was man schon ist. (Henry Ford) :lol2

  • DRDB ist wohl in CentOS Extra dabei.

    Allerdings muss ich zugeben, dass ich fuer die naechsten Wochen absolute keine Zeit habe, das auszutesten.

    Vorerst werde ich wohl einen anderen Weg waehlen (rsync auf eine virtuelle Disk .vmdk), damit ich die Datensicherheit erst mal habe.

    Auf jeden Fall werde ich das im Auge behalten und sobald ich Zeit und Ergebnisse haben, werde ich berichten.

    vielleicht mag ja jemand anders auch noch damit ein wenig herumspielen und berichten ;)

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Hier würde ich ebenfalls rsnapshot empfehlen. Durch die Verwendung von Hardlinks wird für jedes inkrementelle Backup nur so viel Platz verbraucht wie für die veränderten/neuen Dateien benötigt wird und trotzdem hat man bei jedem einzelnen Backup Zugriff auf den kompletten gesicherten Verzeichnisbaum ohne spezielle Tools zu benötigen.

    Quote

    Bei welchem der genannten FS gibt es denn Kompression?


    Bin mir nicht sicher, aber gibt es nicht inzwischen für die Komprimierung eine ähnliche Lösung wie's z.B. ecryptfs für's Verschlüsseln ist? Ansonsten bleibt wohl nur auf btrfs zu warten.

    Bye...

    Dirk

  • Quote

    Original von knebbWas ich halt suche, ist wirklich rsync blockbasiert. Gibt es aber wohl nicht. Also Dateisystemreplikation. Problem dabei ist aber, dass ich das lokale Dateisystem nicht ausbremsen moechte, nur weil das remote System max. 2Mbit Anbindung hat. Sollte also offline passieren.

    Noch jemand Ideen?

    Nochmal: OpenAFS. Da passiert die Synchronisation der Replikas nur auf Zuruf.

    Bye...

    Dirk

  • Quote

    Original von knebbProblem ist dabei aber, das das Source-Dateisystem massiv aus Hardlinks besteht.
    So braucht rsync damit unter massivem Speicherbedarf trotz nur kleiner Aenderungen knapp 24h zum Abgleich....faellt also aus.

    Du solltest es mal mit einer Rsync Version >= 3.0.x versuchen. Und zwar auf beiden Seiten, dann klappt das auch mit Millionen von Dateien, die ebenfalls auch im Grossteil aus Hardlinks bestehen. Der Unterschied zu den alten 2.xx Versionen ist jedenfalls gewaltig.

    Siehe auch http://rsync.samba.org/ftp/rsync/src/rsync-3.0.0-NEWS unter Absatz ENHANCEMENTS:

    A new incremental-recursion algorithm is now used when rsync is talking to another 3.x version. This starts the transfer going more quickly (before all the files have been found), and requires much less memory. See the --recursive option in the manpage for some restrictions.

  • Quote

    Originally posted by cjhbabel

    Du solltest es mal mit einer Rsync Version >= 3.0.x versuchen.


    Nein, ist kein wirklicher Unterschied. Klar, der Speicherverbrauch reduziert sich, aber die Analyzezeit ist ziemlich die gleiche, da rsync wohl alle Hardlinks ueberprueft. Warum auch immer, es dauert ewig.

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

  • Yohoo!

    So, ich habe jetzt mal DRBD getestet. Ist im "Extras" Paket von CentOS5 schon dabei- von daher keine grossen Orgien mit make usw.

    Das scheint mir ziemlich genau das zu sein, was ich suche. Werde natuerlich noch ein wenig herumexperimentieren. Aber bisher sieht's gut aus.

    Das Schoene daran scheint zu sein, dass es auch eien drdb-Proxy anbietet. D.h. wenn der Zweite nicht schnell genug arbeiten kann, wird der Erste nicht geblockt, sondern kann weitermachen. Der Proxy uebernimmt dann das Puffern.

    Mal sehen, ob eine 2Mbit Leitung dafuer gut genug ist ;)

    Hmm..mal rechnen: taegliche Datenmenge ca. 8-10GB. Manchmal auch mehr, manchmal weniger.
    Hmmm...nach Bandbreitenrechner braucht eine 2Mbit Leitung dafuer ca. 10h.... :schiel Ich will aber ja nicht die ganze Bandbreite dafuer "opfern". Also gem. den DRBD Empfehlungen max 30%. :evil:

    Das wird also wohl "verdammt" eng. :sure

    Ach egal, ich probiere das einfach mal aus.
    [edit]
    Hrmpf...der DRBD Proxy, der das Ganze auch mit lahmen Leitungen akzeptabel macht, ist nicht OpenSource. Dadurch ist der lokale Host auf die Geschwindigkeitsbremse des Netzwerkes "angewiesen". D.h. lokal auch nur 2Mbit/sec. Faellt in der Form also aus.
    Mit ein paar Tricks (manuelles Abschalten des secondary Nodes) klappt das vielleicht doch noch.
    Wird aber heute nicht mehr getestet :)

    Glotze: yaVDR (ASRock Q1900M, 4GB RAM, DD Cine S2 V6.5, ZOTAC GT630 (Rev. 2)
    Server: HP ProLiant MicroServer G8, VMware ESXi 5.5 :P

    Edited once, last by knebb (September 22, 2009 at 12:21 AM).

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!