gelöst: Hilfe, mein System stirbt nach exakt 60 Minuten

  • Schon probiert, aber im BIOS war nix zum Thema Power-Save was man einstellen konnte.


    So, ich glaube aber ich habe es. Soeben ist mein Rechner zum ersten Mal über eine Stunde gelaufen. Leider habe ich 3 Sachen auf einmal verstellt und nun muss ich noch rausfinden, welche von denen es war. Sobald ich sicher bin, melde ich mich wieder.

  • Bin ja mal neugierig.

  • Die wahrste und beste Beschreibung über Linux "Linux - das grösste Textadventure aller Zeiten" hat sich mal wieder bewahrheitet. Also, nun läuft es also problemlos.


    Ich bin immer noch nicht 100% sicher was den Grund angeht, aber nach dem aktuellen Stand der Ermittlungen war es weder APM noch APCI noch APIC noch Netzwerk noch cron/atd noch VGA, und "proffie" war wohl derjenige, der am nächsten dran war.


    Kurze Erklärung: Ich glaube, das das einmalige Setzen der Uhr mit hwclock das Problem gelöst hat. Evtl. war irgendwas im BIOS nicht richtig initialisiert und beim Auslesen der Uhrzeit gab die HW-Uhr einen Wert zurück, der nicht korrekt formatiert war oder so? Klingt wirr, aber im Moment habe ich keine bessere Erklärung für das Verhalten. Auslöser war wahrscheinlich der "courier" MTA daemon, der aber selber wohl nicht Schuld hatte, sondern nur nach 1 Stunde das Signal zum Absturz gab.


    Lange Erklärung:


    Mir ist gestern abend aufgefallen, dass in der Syslog irgendwo beim booten ein Eintrag war:

    Code
    10:12:23 courierd: Waiting.  shutdown time=Mon Jan 16 11:12:23 2006, wakeup time=Mon Jan 16 11:12:23 2006, queuedelivering=0, inprogress=0


    HA! dachte ich, jetzt habe ich ihn! "required stop" genau 1 Stunde nach dem start, das muss es sein. Oder? Also habe ich courier erstmal zum Testen von hand gestoppt.


    Nun war es mir ein wenig langweilig, eine Stunde zu warten, und so kam ich auf die Idee, mal die HW-Uhr etwas weniger als 1 Stunde vorzustellen. Das System lief nun problemlos weiter, auch über 1 (echte) Stunde lang. Also dachte ich: Das ist der Beweis, dass es courier war.


    Um das zu testen, habe ich dann rebooted, courier jetzt normal laufen lassen und die Uhr 58 Minuten vorgestellt. Eigentlich hätte der Fehler jetzt nach 2 Minuten auftreten müssen. Tat er nicht, und auch nach über 1 Stunde lief das System immer noch. Hmmm...


    Dritter Test: nochmal rebooted und diesmal NICHT an der Uhr gespielt. Courier lief dabei wieder ganz normal, und das System schaffte es locker über die magische Stunde...


    Inzwischen habe ich einen mit partimage gesicherten Stand zurückgespielt, den ich gemacht hatte bevor ich mit der Fehlersuche anfing. In diesem Stand ist alles wieder 100% so wie zuvor, als der Fehler jedesmal auftrat - und dieser Stand ist dann die ganze Nacht durchgelaufen, mit aktivem courier und allem.


    Warum das ganze mit Kanotix lief, weiss ich auch nicht, aber dort started (und restartet) auch nicht courier als MTA soweit ich mich erinnern kann...


    Also wenn jemand eine bessere Erklärung hat, immer her damit.


    Ansonsten vielen vielen Dank für alle, die sich an der Fehlersuche beteiligt haben, und die vielen nützlichen Tips und Hinweise gegeben haben, das war wirklich ermutigend. Ohne Euch hätte ich die Brocken schon längst hingeschmissen!

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!