[0.4] Server instabil, TeVii S480 Problem ? -> !

  • Tach ihrs!


    Mein Server macht zicken und ich bin mal wieder reichlich verzweifelt :( Gefühlt fing alles damit an, als ich das erste Mal XBMC aufm Client startete und die Libs basierend auf den Daten des Servers (avahi-mount) aufbaute. Das sorgte "nur" für paar Abstürze zwischendurch und die RAM-Problematik. Anschließend habe ich epgsync und remotetimers installiert und zeitgleich ein BIOS-Update des Servers gemacht; seitdem gibts nur noch Probleme. Die Details:


    Symptome:
    - die CPU Last ist so gut wie immer bei 1.2 und mehr
    - bis vor kurzem (kann nicht sagen, wodurch es aufgehört hat) ist der Speicher sukzessive vollgelaufen: alle paar Sekunden ein oder paar MB in den Speicher, bis 4GB voll waren; und dann fing das Bildruckeln (FPS<2) richtig an
    - Verbindungsabbrüche des Clients (würde ich aber auf den sichtlich überforderten Server zurückführen)
    - bei Aufnahmen fehlen deutliche Stücke (>20 min.)


    Systeme: (beides yaVDR 0.4, bei beiden update/dist-upgrade durchgeführt)
    - Server: default, bis auf: zusätzliche ext4 Platte, die per avahi ins Netz gestreut wird
    - Client: default + epgsync, remotetimers, streamdev-client


    Logs:
    ServerLog vom Abend: diverses Umschalten und gegen Ende eine (korrumpierte) Aufnahme
    ServerLog von heut morgen : boot, reboot, shutdown & boot, deutlicher "Hänger"


    Logauffälligkeiten:
    - nachdem mir gestern schon einige "chaning pids ..." aufgefallen sind, hab ich das Updaten der Channels abgestellt -> keine Änderung
    - "frontend 1/0 lost lock on channel / regained lock on ... " hab ich im Forum gesucht -> soll auf schlechten Empfang (?) hindeuten -> femon zeigt grüne Werte auf den gängisten Transpondern
    - "buffer usage: 100% (tid=1969)" gefolgt von "ring buffer overflows" dürfte gar nicht gut sein, aber wo kommt es her? (war ja vorher in Ordnung)
    - was soll mir "XVDR: Timers state changed (6)" sagen?
    - Absturz (zweites Log) ab Dec 1 07:58:53 -> bedingt durch buffer ?


    Hab im Forum schon mal geschaut und bisher aber nur einzelne Sachen gefunden, die irgendwie nichts mit meinem Problem gemein haben; vielleicht fehlt mir hier einfach der Überblick über das Gesamtsystem. Hat jemand mit diesem eine Idee?


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

    2 Mal editiert, zuletzt von whitedwarf ()

  • Aus dem "Serverlog von heute morgen" fallen mir zwei Stellen ins Auge:


    Code
    Dec  1 07:55:04 whiteyaVDRsrv vdr: [1805] TS continuity error (4)
    Dec  1 07:55:04 whiteyaVDRsrv vdr: [1805] TS continuity error (9)
    Dec  1 07:55:04 whiteyaVDRsrv vdr: [1805] TS continuity error (12)
    Dec  1 07:55:04 whiteyaVDRsrv vdr: [1805] cAudioRepacker(0xC0): skipped 400 bytes to sync on next audio frame
    Dec  1 07:55:04 whiteyaVDRsrv vdr: [1805] PES packet shortened to 5792 bytes (expected: 6160 bytes)
    Dec  1 07:55:31 whiteyaVDRsrv vdr: [1806] buffer usage: 70% (tid=1805)
    Dec  1 07:55:32 whiteyaVDRsrv vdr: [1806] buffer usage: 80% (tid=1805)
    Dec  1 07:55:32 whiteyaVDRsrv vdr: [1806] buffer usage: 90% (tid=1805)
    Dec  1 07:55:32 whiteyaVDRsrv vdr: [1806] buffer usage: 100% (tid=1805)


    Und direkt danach dann (mit darauf folgendem Kernel dump):


    Code
    Dec  1 07:58:53 whiteyaVDRsrv kernel: [  840.377389] INFO: task jbd2/dm-0-8:267 blocked for more than 120 seconds.


    Das eine ist ein Empfangsproblem, das andere evtl. ein Festplattenproblem (LVM?) im weitesten Sinne. Ob beide zusammenhängen - keine Ahnung.


    Eine Google-Suche nach " INFO: task jbd2/dm blocked for more than 120 seconds" mag sinnvoll sein.


    Gruß
    hepi

  • Empfangsproblem? wie würde ich das testen, nachdem femon mir bereits grüne Balken bescheinigt?


    Bzgl. des kernel-dumps: wird ein "smartctl -a /dev/sda" das Problem eingrenzen/bestimmen können?


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • 2 Platten im Server:


    auf der ersten (160GB) ist yaVDR mit LVM installiert worden
    auf der zweiten ist ein etx4 mit Medien drauf


    defekt weiß ich nicht. smartctl meldet bei keiner von beiden Fehler. badblocks kann ich auf der laufenden yaVDR-Platte nicht ausführen, das werd ich später mal mit 'ner LiveCD ausprobieren (bzw. nach 'ner Möglichkeit suchen, das vllt. so zu machen). Bei der zweiten läuft gerade badblocks durch ...


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • smartctl kann den langen Smarttest anstossen, der testet während des Betriebes (ohne das der Betrieb gestört wird) auf Badblocks (passiert transparent auf der HDD selber ohne das Linux beteidigt ist).


    smartctl -h
    --
    smartctl --test=long /dev/hda (Executes extended disk self-test)
    --


    cu

  • der testet während des Betriebes (ohne das der Betrieb gestört wird) auf Badblocks


    vielen Dank, das ist mal ein praktischer Tipp, badblocks dauert bei einer 2TB Festplatte ewig. Werde mich wohl auf euer beider Geheiß hin mit e2fsck, badblocks und smartctl beschäftigen dürfen/müssen.
    Das wird aber erst heute abend gehen. Dann probier ich auch mal, die Medienplatte auszuhängen und schau, ob es nicht vllt. damit schon geholfen ist (dann ist der Fehler ja isoliert). Unabhängig davon: empfiehlt es sich yaVDR grundsätzlich ohne LVM zu installieren? (falls ja, würd' ich das einfach nachholen)


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • Faustregel: Wenn man sich eh mit LVM nicht auskennt und es nicht schon erfolgreich auf anderen Rechnern im Haus einsetzt, sollte man bei yaVDR auch die Finger von LVM lassen. Es läuft auch wunderbar ohne und es macht die Wartung für den normalen Nutzer viel einfacher.


    Gruß
    hepi

  • Faustregel: Wenn man sich eh mit LVM nicht auskennt und es nicht schon erfolgreich auf anderen Rechnern im Haus einsetzt, sollte man bei yaVDR auch die Finger von LVM lassen. Es läuft auch wunderbar ohne und es macht die Wartung für den normalen Nutzer viel einfacher.


    alles klar. Für meiner einer heißt das: Finger weg von LVM ;)


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • nun, es ist mal wieder einiges an Zeit ins Land gegangen und die Fünkchen Hoffnung(en), die ich hatte, haben zu Gunsten von purer Resignation Platz gemacht.


    was ich noch gemacht hab:
    - smartctl beide Festplatten gescannt (long und short test): keine Fehler
    - zum bloßen Testen die Medienplatte ausgehangen: keine Verbesserung
    - badblocks -svb 4096 /dev/sda -> keine
    - komplett neu installiert und dabei LVM weggelassen: Status unverändert


    beim Fahnden bin ich auf die TeVii S480-Problematik gestoßen (, die teilweise ähnliche Symptome aufweist/-wies) :
    - Strom: eigentlich braucht mein LNB max. 190mA laut Anleitung, 300mA ist PCIe im Stande zu leisten; hatte mir ja darüber auch keine Sorgen gemacht, weil ich ja durchaus ein Bild auf beiden Tunern hab. Egal: Kabel dran: kein Unterschied
    - Treiber: Firmware (/lib/firmware/dvb-usb-s660.fw) ist und war die richtige (md5: 2946e99fe3a4973ba905fcf59111cf40 ); dennoch hab ich mal explizit linux-media-dkms (darin ja s2-liplianin enthalten) drübergebügelt: keine Änderung
    - idle bei dynamite: ist gar nicht gesetzt
    - ident_state.patch: soll ja nur den S3 verbessern, oder hat er was mit meinem Problem zu tun?


    nochmal zu den Symptomen:
    - CPU-Last ist jetzt eigentlich recht selten so hoch
    - der TS Continuity Error tritt ebenfalls nicht annähernd häufig auf
    - häufig im Log: frontend lost lock on ...
    - häufigster Crash: Buffer Usage steigt von 60% auf 100% in Zehnerschritten, dann gibt's meist ein ring buffer overflow und ggfs. (nicht annähernd immer) verabschiedet sich dabei der kernel; der Zeitpunkt dabei ist nicht deterministisch, passiert mal nach 12 Mins uptime, mal nach ~40, mal läuft er 2 Stunden durch


    eine Kleinigkeit (?) noch: beim durchstöbern und googlen diverser kernel-log-Einträge bin ich auf folgendes gestoßen: (im Zusammenhang mit "ioremap error for 0xdf5fd000-0xdf5fe000, requested 0x10, got 0x0" ) ein

    Code
    sudo cat /proc/meminfo | grep -i Vmalloc

    gibt lustiges

    Code
    VmallocTotal: 34359738367 kB 
    VmallocUsed: 344932 kB 
    VmallocChunk: 34359367324 kB

    34 TeraByte für virtuelle Speicherverwaltung ... das soll glaub ich nicht so sein, oder?


    Ansonsten bin ich mal wieder dankbar für jegliche Hinweise, mögen sie noch so abwegig sein.


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • Hallo whitedwarf,


    Ansonsten bin ich mal wieder dankbar für jegliche Hinweise, mögen sie noch so abwegig sein.


    Hier hast du welche.


    Anschließend habe ich epgsync und remotetimers installiert und zeitgleich ein BIOS-Update des Servers gemacht; seitdem gibts nur noch Probleme.


    Wie Du siehst, habe ich die gleiche Karte wie Du, aber keinerlei Probleme. Das hilft Dir natürlich nicht weiter. Dein MB ist recht aktuell, sogar EFI! Weißt Du noch, was vor dem EFI, bzw. BIOS-Update für die Festplatten eingestellt war? Da gib es allgemein ausgedrückt so manche Möglichkeiten, z.B. AHCI, IDE-Übersetzung, RAID… Die 2 TB ist fast grenzwertig. Verwendest Du MBR oder GPT, dann geht es weiter mit LVM und ext4. Ich habe schon mehrere Systeme gesehen, die nach einem BIOS-Update (anschließend Defaults) sich sehr seltsam benommen haben. Vielleicht mal im EFI mit dem Eistellungen spielen. Erfolgt natürlich auf eigene Gefahr (VORHER sichern!), hat aber oft geholfen. Wenn es schief geht, eine Neuinstallation wird vermutlich sowieso Deine Probleme lösen.


    Albert

  • eine Neuinstallation wird vermutlich sowieso Deine Probleme lösen.

    ähm, nein, eben nicht:


    komplett neu installiert und dabei LVM weggelassen: Status unverändert


    Und zum BIOS-Update: die Probleme waren durchaus auch schon vorher da. Dennoch: wie gesagt ist LVM nicht drauf und die 2TB-Festplatte war zwischenzeitlich komplett raus aus dem System, d.h. es liegt definitiv nicht an ihr. RAID ist nicht an, sonst habe ich eigentlich nichts verändert, ich schaue nachher aber noch mal zur Sicherheit drüber, ob da was auffälliges dabei ist.


    weiteres?


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • komplett neu installiert und dabei LVM weggelassen: Status unverändert


    Sorry, habe ich überlesen.


    Wer frisst denn so viel Speicher? Gib mal bitte an der Konsole einfach top ein. Was spricht er?


    Albert

  • Wer frisst denn so viel Speicher? Gib mal bitte an der Konsole einfach top ein. Was spricht er?


    Ich habe Zweifel, dass du da viel sehen kannst. Vmalloc sind ja allocs des Kernels, das wirst du wohl nicht einem Prozess zuordnen können, vermute ich.
    Andererseits würde ich auch nicht viel darauf geben. Bei mir sieht das ähnlich aus und ich habe keine Probleme.


    whitedwarf: another useless use of cat ;)
    nicht so:

    Code
    sudo cat /proc/meminfo | grep -i Vmalloc


    sondern so:

    Code
    sudo grep -i Vmalloc /proc/meminfo


    Gerald


    HP Proliant MicroServer Gen8, Xeon E3-1230, 12 GB RAM, 3xWD red 2TB im RAID 5, 2xSundtek MediaTV Home DVB-C/T, L4M TWIN-C/T, Ubuntu Server 14.04.1, Plex Media Server
    Samsung UE55H6470

  • Ich habe Zweifel, dass du da viel sehen kannst.


    Ich auch. Mit "watch cat /proc/meminfo" darf er auch nur beobachten wie der Speicher und swap aufgefressen werden.


    BIOS und OS aktuell, neu installiert. In der Regel ist Natty stabil und S480 macht auch keine Probleme. Daher habe ich mal kurz gegoogelt. Gefunden habe ich das hier.


    Auch wenn die S480 eine PCIe Karte ist, dank chinesischen Ingenieurkunst hängt sie zweimal als USB-Device an den selben USB-Bus. Damit hätten wir wohl das selbe Problem wie unsere Zeitgenosse aus dem Ubuntu Forum, jedoch keine Lösung.
    Das Problem wäre damit eine unglückliche Konstellation zwischen dein MB, S480 und oder Natty. Ich hoffe für Dich, das ich mich irre!


    Albert

  • Hi white,


    was neues?


    Albert

  • was neues?



    ja, durchaus. Dieses Wochenende bin ich dazu gekommen, die S480 mal auszubauen, und die alte SkyStar2 reinzusetzen: siehe da, keinerlei Probleme nochwelcher Art. D.h. Schuld ist definitiv die S480. Nur hab ich keine Ahnung, was ich jetzt tun kann, schließlich habe ich ja auch schon danach gefahndet und außer die neuesten Treiber zu benutzen habe ich nicht viel finden können.
    Hat vielleicht jemand Ideen, welche expliziten Tests ich dem System antun könnte, um weitere Hinweise zu bekommen? Oder ist es eher sinnlos, MB, S480 und Rest vertragen sich einfach nicht und dann brauch ich halt 'ne andere?


    whitedwarf


    Nachtrag: hat mein System vllt. was mit diesem Problem zu tun?

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • Moin!


    Versuche mal, den Slot frei zu pusten, vielleicht sorgt ein wenig Staub dafür, dass sich die Kombination komisch verhält.
    Auch mal die Kontakte der Karte mit einem Radiergummi säubern.


    Lars.

  • ok, das war definitiv noch nicht als Lösungsansatz dabei. Weil das so schwer remote durchzuführen ist, wird das bis heute abend warten müssen :) Wobei ich es dann aber auch gar äußerst merkwürdig finden würde: schließlich hab ich die Teile erst Anfang Oktober gekauft (MB, Sat-Karte, ...).


    whitedwarf

    Server: yaVDR 0.6.1, ASRock H61M-U3S3, Asus P8H61M, Intel G860, Scythe Big Shuriken 2, ASUS ENGT520 Silent, Silverstone SuGo SG02B-F, 2x2GB Kingston, BeQuiet PurePower L7 300W, 4TB HGST, TeVii S480 v2.1
    Client: yaVDR 0.6.1, ASRock H67M-ITX, Intel G860 Boxed, ASUS ENGT520 Silent, JCP MI-111.B, 2x2GB Kingston, Xilence SFX SPS.XP200

  • Hallo white,


    eher sinnlos, MB, S480 und Rest vertragen sich einfach nicht und dann brauch ich halt 'ne andere


    so sehe ich es. Es ist kein yaVDR Problem. Es gibt vereinzelt Probleme mit der S480, überwiegend bei schnellen Systemen (SSD), wenn ich es richtig verfolgt habe. Das Problem bei Dir scheint am Board zu liegen. Woanders verträgt sie auch keine zwei gesteckte USB Devices am selben Bus, welcher Art auch immer. Auch wenn das jetzt hart klingt, an Deiner Stelle würde ich einen anderen Board nehmen. Manche Händler sind auch kulant. Einfach versuchen.


    hat mein System vllt. was mit diesem Problem zu tun?


    Eher nicht, aber Lars hat Dir schon geantwortet.


    Albert

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!