[Solved] Probleme mit irgendeinem Dienst (vermutl. at) und Auslagerungsspeicher

  • Hallo,


    habe hier ein geringfügig aufgebohrtes Mediaportal (PIII, 900MHz und 256MB RAM), was mir Probleme bereitet.


    Das Mediaportal läuft unter Debian Etch mit den Paketen von e-tobi. Den 23er Kernel, LIRC und die DVB-Treiber habe ich selbst kompiliert.


    Nach dem Hochfahren kommt irgendwann ein Bild. Allerdings geht alles nur sehr träge. Bin der Sache dann mal auf den Grund gegangen. Hatte dabei aber alle Mühe mich via SSH überhaupt einloggen zu können. Irgendwas hat da die ganze Zeit bei der Festplatte rumgerödelt.


    Jedenfalls hat sich nach erfolgreichem Login dann herausgestellt, dass syslog auf beachtliche mehrere hundert MB angewachsen war. Kann ich natürlich schlecht posten. Es dauert auch ewig, bis ich syslog überhaupt angezeigt bekomme und dann springt es nur zeilenweise, weil er parallel ja immer bei der Festplatte rumrödelt.


    Ich hatte dann den Auslagerungsspeicher im Verdacht. Swap habe ich mit 512 MB angegeben. Und siehe da, der RAM wurde nicht komplett benutzt und SWAP war zur Hälfte in Benutzung. Also angewiesen, dass er zunächst mal den Arbeitsspeicher nutzen soll. Immer noch keine Besserung.


    Nachdem ich da nicht voran kam, habe ich syslog erst einmal gelöscht. Der Rechner schien danach langsam zur Ruhe zu kommen.


    Irgendein Dienst muss ja die umfangreiche Syslog-Ausgabe verursachen, die anscheinend die Ursache für die Festplattenrödelei ist und offenbar auch dazu führt, dass SWAP genutzt werden muss.


    Hier nun die Ausgabe von top:

    Werdet Ihr da schlau draus? Wo könnte ich evtl. den Hebel ansetzen? Ist es normal, dass da 3x atd aufgeführt ist? Und was bedeuten die zwei zusätzlichen atd-Einträge mit <defunct> ?


    Vorab einmal mehr besten Dank für die Hilfe!


    Grüße
    Boss666

  • hi,


    nur ein Hinweis (zu ct kann ich eh nichts sagen) Das Netzteil vom MP hast schon zu div. Fehlern geführt. Hast du das mal angeschaut? Sind verdächtige elkos drauf zu erkennen?


    http://www.htpc-forum.de/forum/index.php?showtopic=1405


    Gruss Lexi

  • Hallo Lexi,


    ja das mit den NT-Problemen beim MP hatte ich schon gelesen, bevor ich mir das MP gekauft hatte.


    Na wäre ja ein Ding, wenn das nachher Einfluss auf die HDD-Aktivitäten nehmen würde. Die Elkos beim NT machen aber alle noch einen guten Eindruck. Würde das als Ursache mal ausschließen. Trotzdem vielen Dank!

  • Hallo,


    Zitat

    Original von Boss666
    Hallo,
    [ .... ]
    Hier nun die Ausgabe von top:[code]top - 01:50:53 up 7 min, 1 user, load average: 626.57, 653.86, 309.15
    Tasks: 1595 total, 19 running, 64 sleeping, 0 stopped, 1512 zombie



    Coole load, Achtung Zombies ;-9
    1. Was macht der atd da mit sovielen Prozessen? atq auf der Kommandozeile als root sollte anzeigen was da laufen will
    2. Was sind die ganzen Zombies die da liefen? ps aux |grep Z (Schnellschuss, wir suchen die Prozesse die in der Spalte STAT ein Z haben)


    Gruss

  • Hallo,


    sorry, wofür genau steht das load?


    Ausgabe von atq:


    Heisst also vdr will laufen? Tut er doch aber auch... oder eine weitere Instanz?


    Ausgabe von ps aux | grep Z:

  • Niemand eine Idee?


    Syslog ist gespickt mit derartigen Meldungen:

  • Zitat

    Original von Boss666
    Niemand eine Idee?


    Syslog ist gespickt mit derartigen Meldungen:

    Code
    Feb 12 19:41:56 mediaportal147 atd[10015]: File a0002601318158 is in wrong format - aborting
    Feb 12 19:41:56 mediaportal147 atd[10029]: File a0002b0131b3e0 is in wrong format - aborting


    Hallo,



    für mich sieht es so aus als ob Dein atd kaputt ist. Die Ursache hierfür ist mir unklar (ich habe noch nie einen atd sterben sehen). Versuche bitte folgendes:


    1. ATD stoppen. Zuerst über die Distriscripte. Ich weiss nicht genau wie das bei Deiner Distribution funktioniert aber ein /etc/rc.d/atd stop, rcatd stop oder /etc/init.d/atd stop sollte helfen. Anschliessend die übrigen atd prozesse killen: killall atd ; sleep 10 ; killall -9 atd


    2. alles unterhalb von /var/spool/atd* (Verzeichnis koennte Distrib abhängig sein, bitte kontrollieren) aufräumen: als root find /var/spool/atd* -type f -print0 |xargs -no-run-if-empty -0 /bin/rm -f . Dieser Befehl sucht alle Dateien unterhalb der Verzeichnisse atd* und übergibt sie rm zum löschen. Wenn Du neugierig bist koenntest Du Dir mal so eine Datei (vorher) ansehen, ich vermute ein kaputtes Dateisystem das irgendwelchen Müll hier hinterlassen hat.


    3. So jetzt könnntest Du die Load und die Zombies kontrollieren. Die Load sollte weniger werden, die Anzahl der Prozesse im Zustand Z wird leider nicht weniger (Zombies sind schon tot, die kann man nicht mehr töten.)


    4. Wenn die Load wirklich weniger geworden ist (der Befehl uptime sagt Dir das) wars der ATD, nun stellt sich die Frage woher all die vielen kaputten Jobs gekommen sind. Oder Du ignorierst das ganze und startest den atd mal versuchweise neu (am einfachsten ist hier vielleicht ein Rechnerneustart, das würde auch die Zombies töten.)


    5.Nach dem Neustart: Was sagt uptime? was sagt ps aux |grep Z , was sagt ps aux |grep atd und find /var/spool/atd* -tpye f |wc -l
    [/list]


    Zur Erklärung:
    atd: - run jobs queued for later execution führt also irgendwelche Befehle zu irgendwlchen Uhrzeiten aus man at sollte helfen.
    load: Durchschnittliche Anzahl der Prozess, die in der letzten Minute laufen wollten (wenn 2 Prozesse immer laufen wollten und Du hast nur eine Cpu musste einer immer warten ... Wenn 700 wie bei Dir laufen wollten und Du hast gerade nicht die neuste IBM mussten wahrscheinlich so ca 698 warten)



    Gruss

  • Danke schonmal!


    atd ist bei mir als Dienst /etc/init.d/atd ... sollte sich mit stop dann auch anhalten lassen.


    Bevor ich loslege: Was hat es mit den Dateien unterhalb von /var/spool/atd* (Verzeichnis distriabhängig) auf sich? Wenn ich da alles weglösche, gibt es aber keine Probleme nach nem Neustart, weil sich irgendwelche Dienste nicht mehr starten oder?


    Kann man das vermutlich kaputte at oder atd eigentlich neu installieren?

  • Hallo mein Freund,


    Zitat

    Original von Boss666
    Bevor ich loslege: Was hat es mit den Dateien unterhalb von /var/spool/atd* (Verzeichnis distriabhängig) auf sich?


    Bei deinem Debian sollte der Pfad eigentlich: /var/spool/cron/atjobs sein. Dort kannst du alle Dateien drin löschen. In diesen Dateien werden die Daten zu den at-jobs gespeichert.


    Gruß
    Steffen

  • Zitat

    Original von Boss666
    Kann man das vermutlich kaputte at oder atd eigentlich neu installieren?


    Da müsste doch prinzipiell nen "aptitude reinstall at" reichen, vorher evtl. nochmal nen "aptitude clean" machen, um alle runtegeladen Pakete aus dem cache zu löschen, (falls da noch was im Cache liegt das schon kaputt ist)

    Server: Hardware: Intel DH77KC, Celeron G1610, 8GB RAM, 2x 5TB HDD, 2x WD 1,9TB HDD; 1x 64 GB SSD (root), System Ubuntu 18.4 / YaVDR ansible headless
    Client: Hardware: Lenovo Q150 (nur Netzwerk, 1GB RAM, ohne DVB-Karte, Igor-USB-Empfänger) System: Ubuntu 18.4 / YaVDR ansible

  • Prima, ich danke Euch!


    Ich habe mit

    Code
    rm -rf /var/spool/cron/atjobs/*

    alle Dateien in dem Verzeichnis gelöscht und dann

    Code
    aptitude clean

    ausgeführt. Anschließend mit

    Code
    aptitude reinstall at

    das Paket neu installiert.


    Last but not least ein reboot. Jetzt schaut es wieder normal aus. :portal1

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!