Ubuntu: Anzeige des Speichers in dmesg

  • Hallo,


    auf der Suche nach einem Problem (merkwürdige Unterschiede in der Systemleistung von Reboot zu Reboot, 3 von 7 Reboots sind so auffällig, SSD liefert reduzierte Leistung (schon ausgetauscht), NIC auch) bin ich darüber gestolpert, wenn ich einen diff des dmesg Gutfall mit Schlecht-Fall mache, dass der Speicher sich unterscheidet (!).


    Ist das normal?

  • Was genau heißt, dass der Speicher sich unterscheidet? Meinst du die Zahl der erkannten RAM-Riegel oder die Auslastung von Arbeitsspeicher und Swap (free -h)oder etwas anderes?

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • nee, sitze gerade nicht vor dem Rechner, aber es geht um eine Zeile im dmesg (kurz gegoogelt, genaues Zitat kommt nachher)

    Code
    Memory: 32768K/xyzK available…

    und in zwei Bootvorgängen unterscheidet sich die ganz linke Zahl ganz leicht, wenige kB. Ich hätte aber gedacht, das ist Hardware und bleibt gleich. Wie gesagt, nachher kann ich es genau zitieren.

  • (merkwürdige Unterschiede in der Systemleistung von Reboot zu Reboot, 3 von 7 Reboots sind so auffällig, SSD liefert reduzierte Leistung (schon ausgetauscht), NIC auch)

    Ich bewundere ja deine Beharrlichkeit, dich mit den Ausfallerscheinungen von 12 Jahre alter Hardware rumzuschlagen.

    Ehrlich, no offense.

    Ich hätte mir da schon längst einen bzw. zwei N100 besorgt, um mich dann ohne Ausfallerscheinungen bei gleicher Leistung an passiven 9W statt aktiv gekühlten 60W idle alleine des Xeon-Servers zu erfreuen.

  • das fasse ich mal als Kompliment auf :)

    Ernsthaft, ich bin genau an der Schwelle. Was ich habe, hatte ich teils schon, aber das, was ich noch brauchte, war natürlich nicht kostenfrei. Ich gebe jedenfalls nicht einen weiteren Euro für das Konstrukt aus, wenn es nicht so hinzubekommen ist, wie ich das gerne hätte. n100 ist andererseits auch nciht so wie ich mir das vorstelle. Aber auch andere Dinge - ich hatte da gerade mal einen Blick auf ein Asus ROG B-550 Gaming, Ryzen 2 4300G, 32GB - kosten und sind dann auch nur ein Kompromiss (ich hätte gerne noch zwei Frontends mehr, just in case). Immerhin bin ich jetzt soweit, dass ich fast glaube, dass das Signal ok ist und wenn es noch Fehler gibt, die irgendwie durch irgendwas Hakendes reinkommen. Als wenn da eine angezogene Handbremse irgendwo ist. Natürlich, auch wenn ich neu kaufe, es wird nicht einfach so funktionieren. Lernen und verstehen muss man in jedem Fall, das ist noch ein Punkt, der mich neben dem ökologischen Aspekt, einfach nicht immer sofort neu zu kaufen, beim alten hält.

  • mir scheint es so zu sein, dass direkt nach Boot, früh genug gemessen, die Performance noch gut ist. Messen tu ich mittels dd if=/dev/zero of=/srv/vdr/video/bigfile.bin bs=1M count=10000 (/srv ist die NVMe-SSD, sollte 3,4++GBps liefern) und mittels scp bigfile.bin <anderer PC> und direkt nach Boot ist es auch gut. Aber dann scheinen in 3 von 7 Fällen die Leistung runterzugehen - das kann doch nicht Stromversorgung oder Hardware sein, wenn es schon läuft. Interrupts? Ich versuche die M4 mal mit dem MSI=0 Parameter. Vorher wird noch der Marvel deaktiviert.

    Edited 2 times, last by cduerr ().

  • 32768k sind nur 32MiB???

    Bei mir ist die Angabe deutlich Größer (Faktor 10), aber deutlich unter dem verbauten RAM.

    Ich würde eher vermuten, dass es die Ramdisk-Größe oder sowas ist, da müsste ich aber auch suchen.

    edit:

    Die zweite Zahl nach dem / gibt die Speichergröße an, man muss die Meldung nur ganz lesen ;):

    Memory: 3595872K/8335796K available

    Wobei das bei mir auch nicht ganz passt (etwas zu klein), die erste Zahl ist der freie RAM.


    Ein echter Hardware-Fehler ist es jedenfalls zu 99,9% nicht.

    Defekter Speicher verursacht Abstürze und nicht sowas.

    Wenn es Hardware-Seitig ist, dann Überhitzung.


    Ich würde mal eine neue CMOS-Batterie einsetzen und wichtig! das BIOS zurücksetzen und ggf. Updaten.

    Merkwürdige Bootprobleme kommen, nach meiner Erfahrung, oft von einer schwachen Batterie.


    Bei der Fehlerbeschreibung wäre mein Tipp aber eher in Richtung Software.

    Evtl. mal mit einer Live-CD einer anderen, älteren Distri versuchen, wenn der Fehler gut reproduzierbar ist.


    Das Phänomen mit der abnehmenden Performance kenne ich übrigens bei SAMBA.

    Die erste Übertragung einer Aufnahme geht ruck-zuck, ab dem zweiten mal ist es viel langsamer.

    Die Ursache konnte ich nicht ergründen, hoffe aber, dass es das nächste Software-Update des Servers beseitigt.


    Du könntest auch mal versuchen testweise das Paket "intel-microcode" zu deinstallieren.

    Das könnte sich auf die Leistung der CPU auswirken.


    Ich hätte mir da schon längst einen bzw. zwei N100 besorgt, um mich dann ohne Ausfallerscheinungen bei gleicher Leistung an passiven 9W statt aktiv gekühlten 60W idle alleine des Xeon-Servers zu erfreuen.

    Das Board sollte idle bei etwa 20-25W liegen, ich habe selber welche aus der Serie und die original Intel-Boards waren immer recht sparsam.

    Die N100 sind sicher eine schöne Basis, aber ist der inzwischen voll unterstützt? Letztes mal, als ich schaute, ging die Videobeschleunigung noch nicht wirklich.

    Generell macht es IMHO schon Sinn den Fehler zu verstehen, bevor man alles neu kauft. Nachher liegt der Fehler wo anders (wie meistens), dann hat man nichts gewonnen.

    Gruss
    SHF


    Edited once, last by SHF ().

  • das hier ist die konkrete Zeile im Vergleich (links baddmesg.txt, rechts gooddmesg.txt)

    Code
    Memory: 32568156K/33379584K available (16393K kernel code, 4 |  Memory: 32568152K/33379584K available (16393K kernel code, 4...

    ich hätte nicht gedacht, dass da was unterschiedliches stehen kann. Aber der Rechner ist stabil, Speicherhardware habe ich eigentlich nicht befürchtet (und glaube es auch nach wie vor nicht). Nur halt komisch. Bin auf eine Erklärung gestoßen, nach der der Speicher dort eben nicht der installierte Hardwarespeicher ist, sondern der zu dem im Augenblick verfügbare Speicher (und wenn überhaupt hätte ich es auch noch falsch gelesen, links ist ja der verfügbare, rechts neben dem Schrägstrich der gesamte). Anyway: Wer den genauen RAM will soll im OS unter /proc/meminfo gucken und da den Total.


    Ich boote einfach mal dieselbe Distro (Clonezilla) zum Test (der Varianz) der SSD/der Netzwerkgeschwindigkeit.

    Ich vermute: Es muss irgendwas softwareseitiges sein, was die Werte runtergehen lässt (erste Benutzung der TV-Karte?). Aber während das bei der SSD z.B. irgendeine Dauernutzung sein könnte, was die serielle Datenübertragungsrate einfach reduziert, fällt mir bei der NIC nichts mehr ein. Oder Power Management.


    Gestern habe ich einfach mal einen ganzen Schwank auf allen Frontends aufgenommen - und bin fehlerfrei. Fast jedenfalls. Die meisten reklamieren Abweichung von der EPG-Zeit, geschenkt. Aber in 4 von 11 Aufnahmen habe ich jeweils einen Fehler und ich vermute, dass das vielleicht derselbe Fehlerzeitpunkt sein könnte bzw. sich da irgendwas beeinflusst.

    Weiß jemand, ob

    a) sich die Fehlerzeitpunkte in Logs befinden oder

    b) ich die Aufnahmen mit einem TS-Analyzer prüfen kann, der mir zumindest die relative Zeit von Prio1-Fehlern ausspuckt?


    (Update:

    Ich habe /usr/local/bin/vdr-checkts gefunden und obwohl es mir nicht die Zeiten gibt, es erzeugt noch mehr Fragezeichen :)

    Mein Live-Frontend zeigt die "Fehler in den Aufnahmen", sprich die Zahl, die in die info geschrieben wurde. Da bin ich bei vier Aufnahmen bei 1.

    Der Check mit vdr-checkts:

    Nur bei der letzten Aufnahme ist der Fehler, der notiert wurde, wirklich im TS zu finden.

    Edited 5 times, last by cduerr ().

  • Also diese Speicherangaben sind bei mir auch unterschiedlich, bislang war mir das noch nicht aufgefallen, faszinierend.

    sudo journalctl | grep Memory: | cut -d ":" -f 4- | sort | uniq

    Dieser kleine Test zeigt bei mir ca. 25 verschiedene Angaben von insgesamt etwa 1000.

    sudo journalctl | grep -c Memory:

    Kurioserweise ist sogar die rechte Seite unterschiedlich, aber nur 2 um 4K verschiedene Werte.

    Ob es da Häufungen bei einigen Werten gibt, habe ich nicht ausgewertet.

    Bei der Menge an Bootvorgängen müssen aber einige Kernel-Updates dabei sein, ich vermute da Abhängigkeiten.


    Ich vermute: Es muss irgendwas softwareseitiges sein, was die Werte runtergehen lässt (erste Benutzung der TV-Karte?).

    Man könnte mal schauen, ob sich an den PCIe-Einstellungen was ändert.

    sudo lspci -vv | grep -E '[0-9][0-9]:[0-9][0-9]|LnkCap|LnkSta'

    Bei Datenfehlern sollte sowieso etwas im Syslog auftauchen.


    Aber während das bei der SSD z.B. irgendeine Dauernutzung sein könnte, was die serielle Datenübertragungsrate einfach reduziert, fällt mir bei der NIC nichts mehr ein.

    Das sollte aber mit den üblichen Tools (top usw.) auffallen, wenn irgendwas das System auslastet.


    Die NIC ist für mich eh so eine Verdächtige. Die 2,5Gb-Teile sind recht neu und Realtek ist schon öfters mit Treiberproblemen aufgefallen.


    Oder Power Management.

    Mit powertop mal die tuneables angesehen?


    Ich habe /usr/local/bin/vdr-checkts gefunden und obwohl es mir nicht die Zeiten gibt, es erzeugt noch mehr Fragezeichen :)

    Irgendwie kommt man mit vdr-checkts an die Position und von da aus auch an die Zeit.

    Wenn ich mich recht erinnere mittels der index-Datei. Ist aber ewig her, dass ich damit was gemacht habe.


    Nachtrag:

    Bei lediglich einen einzigen Fehler würde ich mir den Aufriss aber nicht machen.

    Gruss
    SHF


    Edited once, last by SHF ().

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!