Speicherleck im VDR oder einem Plugin

SHF · 15. Dezember 2021

Zitat von rell

Ich habe ein paar allocs aus dem libleak-log rausgepickt -> https://pastebin.com/raw/Tsjyp43M Das sind überwiegend reallocs. callstack[2957]z.B. ist da richtig gut dabei. Vielleicht hilfts ja.

Libleak hatte ich letztes Jahr oder so auch schon mal versucht. Leider bekommt man da alle EPG-Einträge als falsch positiv angezeigt, weil die z.T. eine Lebensdauer von 2Wochen oder sogar mehr haben.

Code

vdr-2.5.1/epg.c:186 
 186   title = strcpyrealloc(title, Title);
vdr-2.5.1/epg.c:196
 196   description = strcpyrealloc(description, Description);
vdr-2.5.1/epg.c:191
 191   shortText = strcpyrealloc(shortText, ShortText);
vdr-2.5.1/epg.c:94
  94   p->description = strcpyrealloc(p->description, !isempty(Description) ? Description : NULL);



 136 cEvent::~cEvent() 137 {
 138   free(title);
 139   free(shortText);
 140   free(description);

Alles anzeigen

Für mich sieht es aber aus, als ob die Bereiche korrekt wieder freigegeben werden.

Das würde ich auch bei den Anderen sagen.

Allenfalls könnte bei den "components" irgendwo ein Rechenfehler beim Index vorliegen, da sollte nochmal wer anders einen Blick drauf werfen.

Die Meldungen kannst du IMHO jedenfalls ignorieren und raus filtern, sonst siehst du den Wald vor Bäumen nicht.

Ich schätze aber, danach bleibt auch noch eine Menge über.

Ich hatte es damals übrigens anders herum versucht, das EPG zu unterdrücken. Das hat aber nicht wirklich gut geklappt.

Man könnte noch versuchen den EPG periodisch mittels svdrp "CLRE" zu leeren, so dass die Einträge nicht älter als "LEAK_EXPIRE" werden können. Das hatte ich noch nicht versucht.

Auf einem Produktiv-System mit EPGsearch ist das halt keine gute Idee und ich habe am Arbeitsplatzrechner leider keinen DVB-Empfang.

Zitat von rell

Was mit aber aufgefallen ist, dass hier ganz oft 1byte alloziert wird, auch wenn strlen(ShortText) == 0 ist. Wäre es nicht richtig, es so zu machen, wie hier?

IMHO ist es legitim leere Strings zu erzeugen.

Es kann am Ende praktischer sein, einmal sicherzustellen, dass der String existiert, als immer wieder auf Nullpointer abfragen zu müssen.

Viel Speicher braucht das auch nicht.

Code

117      int l = max(dest ? strlen(dest) : 0, strlen(src)) + 1; // don't let the block get smaller!

Wobei mir eben die Zeile aufgefallen ist:

strlen(dest) +1 kann doch kleiner sein als der reservierte Block?

Der Block kann dann doch kleiner werden, aber halt erst beim zweiten Aufruf der Funktion.

Oder täusche ich mich da?

Ein Speicherleck ist das aber wohl eher nicht.

rell · 15. Dezember 2021

Zitat von SHF

Die Meldungen kannst du IMHO jedenfalls ignorieren und raus filtern, sonst siehst du den Wald vor Bäumen nicht.

Ich schätze aber, danach bleibt auch noch eine Menge über.

Ich hatte es damals übrigens anders herum versucht, das EPG zu unterdrücken. Das hat aber nicht wirklich gut geklappt.

Man könnte noch versuchen den EPG periodisch mittels svdrp "CLRE" zu leeren, so dass die Einträge nicht älter als "LEAK_EXPIRE" werden können. Das hatte ich noch nicht versucht.

Auf einem Produktiv-System mit EPGsearch ist das halt keine gute Idee und ich habe am Arbeitsplatzrechner leider keinen DVB-Empfang.

Alles anzeigen

Guter Tip, für mich war es erstmal interessant zu sehen, wer überhaupt zur Laufzeit Speicher haben will. Wenn man die alle durchgeht, sollte der Kandidat ja dann dabei sein?

Zu den leeren Strings kann ich nichts sagen, das kann Klaus wohl beurteilen.

Hier mein Speicherverbrauch über einen Tag protokolliert:

Spoiler anzeigen

Code

14.12.2021 09:00 20052 root 20 0 423912 183924 16392 S 12,5 5,3 84:26.03 vdr
14.12.2021 09:30 20052 root 20 0 423912 184184 16392 S 6,7 5,3 87:54.95 vdr
14.12.2021 10:00 20052 root 20 0 423912 184328 16392 S 13,3 5,3 91:16.80 vdr
14.12.2021 10:30 20052 root 20 0 423880 184628 16392 S 13,3 5,3 94:38.82 vdr
14.12.2021 11:00 20052 root 20 0 424904 184780 16392 S 6,7 5,3 97:53.49 vdr
14.12.2021 11:30 20052 root 20 0 424936 185100 16392 S 6,7 5,3 101:01.55 vdr
14.12.2021 12:00 20052 root 20 0 424924 185352 16404 S 0,0 5,3 104:06.03 vdr
14.12.2021 12:30 20052 root 20 0 424936 185632 16392 S 6,7 5,3 107:25.20 vdr
14.12.2021 13:00 20052 root 20 0 425960 185804 16392 S 6,7 5,3 110:43.50 vdr
14.12.2021 13:30 20052 root 20 0 425960 186068 16392 S 13,3 5,3 113:58.92 vdr
14.12.2021 14:00 20052 root 20 0 425928 186320 16392 S 6,7 5,3 117:17.92 vdr
14.12.2021 14:30 20052 root 20 0 426984 186756 16392 S 6,7 5,3 120:40.47 vdr
14.12.2021 15:00 20052 root 20 0 426984 186996 16392 S 6,2 5,4 124:05.10 vdr
14.12.2021 15:30 20052 root 20 0 426984 187196 16392 S 6,7 5,4 127:31.16 vdr
14.12.2021 16:00 20052 root 20 0 426984 187440 16392 S 6,7 5,4 130:54.35 vdr
14.12.2021 16:30 20052 root 20 0 426952 187672 16392 S 6,2 5,4 134:09.12 vdr
14.12.2021 17:00 20052 root 20 0 427976 187856 16392 S 0,0 5,4 137:33.81 vdr
14.12.2021 17:30 20052 root 20 0 428008 187960 16392 S 6,7 5,4 140:54.06 vdr
14.12.2021 18:00 20052 root 20 0 428008 188200 16416 S 0,0 5,4 144:18.63 vdr
14.12.2021 18:30 20052 root 20 0 428008 188396 16392 S 6,2 5,4 147:42.78 vdr
14.12.2021 19:00 20052 root 20 0 428008 188632 16392 S 12,5 5,4 151:06.26 vdr
14.12.2021 19:30 20052 root 20 0 429000 188768 16392 S 6,7 5,4 154:24.82 vdr
14.12.2021 20:00 20052 root 20 0 429000 188804 16392 S 6,7 5,4 157:43.75 vdr
14.12.2021 20:30 20052 root 20 0 429032 189088 16392 S 0,0 5,4 161:00.16 vdr
14.12.2021 21:00 20052 root 20 0 373336 159188 12900 S 6,7 4,6 163:00.91 vdr
14.12.2021 21:30 20052 root 20 0 429000 189316 16300 S 6,7 5,4 165:15.38 vdr
14.12.2021 22:00 20052 root 20 0 420836 189480 16572 S 13,3 5,4 168:08.97 vdr
14.12.2021 22:30 20052 root 20 0 429000 189732 16572 S 13,3 5,4 171:47.83 vdr
14.12.2021 23:00 20052 root 20 0 430056 189932 16572 S 6,7 5,4 175:24.35 vdr
14.12.2021 23:30 20052 root 20 0 421860 190036 16596 S 0,0 5,4 179:03.91 vdr
15.12.2021 00:00 20052 root 20 0 430024 190044 16548 S 6,2 5,4 182:34.57 vdr
15.12.2021 00:30 20052 root 20 0 430024 190148 16432 S 6,7 5,4 186:08.37 vdr
15.12.2021 01:00 20052 root 20 0 430024 190292 16432 S 6,7 5,4 189:56.15 vdr
15.12.2021 01:30 20052 root 20 0 431048 191044 16408 S 6,2 5,5 193:37.10 vdr
15.12.2021 02:00 20052 root 20 0 431048 191756 16432 S 6,2 5,5 197:45.24 vdr
15.12.2021 02:30 20052 root 20 0 431048 191768 16432 S 6,2 5,5 201:59.75 vdr
15.12.2021 03:00 20052 root 20 0 432104 191972 16432 S 6,7 5,5 206:19.99 vdr
15.12.2021 03:30 20052 root 20 0 433128 193016 16432 S 12,5 5,5 210:43.61 vdr
15.12.2021 04:00 20052 root 20 0 433096 193452 16432 S 6,7 5,5 215:11.49 vdr
15.12.2021 04:30 20052 root 20 0 433096 193584 16432 S 12,5 5,5 219:37.60 vdr
15.12.2021 05:00 20052 root 20 0 433128 193732 16432 S 12,5 5,5 223:57.24 vdr
15.12.2021 05:30 20052 root 20 0 434152 193852 16408 S 6,7 5,5 228:06.50 vdr
15.12.2021 06:00 20052 root 20 0 434120 193932 16432 S 6,7 5,5 232:24.02 vdr
15.12.2021 06:30 20052 root 20 0 434152 194088 16432 S 13,3 5,6 236:49.88 vdr
15.12.2021 07:00 20052 root 20 0 434120 194348 16432 S 13,3 5,6 241:12.87 vdr
15.12.2021 07:30 20052 root 20 0 434120 194444 16408 S 12,5 5,6 245:32.35 vdr
15.12.2021 08:00 20052 root 20 0 434152 192332 14128 S 20,0 5,5 249:24.71 vdr
15.12.2021 08:30 20052 root 20 0 437224 195256 14132 S 6,7 5,6 253:44.32 vdr
15.12.2021 09:00 20052 root 20 0 438248 196308 14108 S 13,3 5,6 258:12.47 vdr
15.12.2021 09:30 20052 root 20 0 438216 196452 14132 S 13,3 5,6 262:41.11 vdr

Alles anzeigen

Rund 12MB/24h. Etwas weniger als bei den Kollegen. Ich bin mir auch nicht mehr sicher, ob das bei aktiviertem EPG-Scan nicht normal ist, wenn ständig reallocs stattfinden? Ich habe übrigens den Code so geändert, dass kein Speicher für leere Strings beansprucht wird.

Gruß

Andreas

rell · 15. Dezember 2021

Ich habe den code von libleak mal angepasst, damit nur jeder 100. Fund geloggt wird. libleak war so eingestellt, dass es sich erst nach 1h eingeschalten hat und auch die allocs am Programmstart habe ich überspringen lassen. Alles, was in vdr gelinkt ist ("ldd vdr") habe ich auf die Blacklist. Der VDR ist eine gute Stunde gelaufen.

Ich komme erst später dazu, genau reinzuschauen, aber wenn jemand Zeit und Interesse übrig hat, kann er ja mal reinschauen... Vielleicht findet sich was auffälliges. Viel Spaß

Das Log liegt hier: http://lima.imkreisrum.de/vdr/

Gruß

Andreas

HelmutB · 15. Dezember 2021

Ich habe kurz in die Datei reingesehen. VonListGarbageCollector oder Purge habe ich nichts gefunden, nur cSchedules::Cleanup().

Code

sum callstack[4155] expires. count=1 size=160/160 alloc=1 free=0
    0x00000000b7e13854  libleak.so  /home/andreas/git/libleak/libleak.c:718  calloc()
    0x00000000b7f3d3c6  ld-2.28.so  /build/glibc-Stc26X/glibc-2.28/elf/dl-tls.c:286  allocate_dtv()
    0x00000000b7f3dd8f  ld-2.28.so  /build/glibc-Stc26X/glibc-2.28/elf/dl-tls.c:532  __GI__dl_allocate_tls()
    0x00000000b7d54aaf  libpthread-2.28.so  /build/glibc-Stc26X/glibc-2.28/nptl/allocatestack.c:621  allocate_stack()
    0x00000000b7d54aaf  libpthread-2.28.so  /build/glibc-Stc26X/glibc-2.28/nptl/pthread_create.c:669  __pthread_create_2_1()
    0x00000000005fa5d0  vdr  /home/andreas/git/vdr/vdr-2.5.1/thread.c:316  _ZN7cThread5StartEv()
    0x000000000057667c  vdr  /home/andreas/git/vdr/vdr-2.5.1/epg.c:1295  _ZN10cSchedules7CleanupEb()
    0x0000000000532bb6  vdr  /home/andreas/git/vdr/vdr-2.5.1/vdr.c:1578  main()
    0x00000000b77bcb40  libc-2.28.so  ../csu/libc-start.c:308  __libc_start_main()
    0x00000000005349f0  vdr
callstack[645] frees after expired. live=4195 expired=190347 free_expired=124
callstack[646] frees after expired. live=4195 expired=86136 free_expired=42
callstack[648] frees after expired. live=4195 expired=71225 free_expired=120
callstack[650] frees after expired. live=4195 expired=53368 free_expired=1994

Alles anzeigen

Leider sagen mir diese Meldungen nichts.

LG Helmut

M-Reimer · 15. Dezember 2021

So leider auch meine Erfahrung mit den ganzen "Leck-Detektoren" die sowas eigentlich einfacher machen sollten.

Bisschen auch ein Nachteil der Sprache an sich. Ja, C/C++ ist extrem maschinennah und entsprechend performant. Aber damit kommt leider auch enorm viel Verantwortung für den Programmierer. Und wir sind halt alle nur Menschen...

Man müsste im Prinzip, sobald man eingegrenzt hat wo das Leck sein könnte, manuell für jedes "alloc" oder "new" prüfen ob hier auch in jeder denkbaren Konstellation ein "free" oder "delete" folgt. Oder ggf. manuell loggen. Sobald man den Pointer hat den als Logmessage ausgeben und das gleiche beim "Wegräumen". Nach längerer Laufzeit sollte es keine größere Menge Pointer mehr geben die nicht weggeräumt wurden.

Um das mal weiterzuspinnen: Kann man nicht auch gezielt ein "Wegräumen" erzwingen? Also nur mal angenommen ich lasse einen VDR nur ein paar Stunden laufen mit einem Logging wie oben beschrieben. Wenn das Aufräumen überall sauber läuft, dann sollte bei sauberem Beenden des VDR ja kein einziger Pointer nicht sauber freigegeben worden sein. Andernfalls kann ja was nicht stimmen. Natürlich räumt der Kernel dann den ganzen Prozess weg, aber sauber wäre eben wenn das Programm vor dem Eingreifen vom Kernel alles schon freigegeben hat.

kfb77 · 15. Dezember 2021

Ich komme mit den "Leck-Detektoren" auch nicht klar. Ich habe bei markad genau so eine Logging Funktion mal eingebaut. Jedes alloc/new wird mit dem Objektnamen in ein Array geschrieben, jedes free/delete löscht den Eintrag aus dem Array. Am Programmende wird das gelogged, was noch im Array drin ist.

War zwar erst mal ein großer Aufwand das überall einzubauen, deckt jetzt aber neue Leaks sofort auf.

Das Ganze ist aus Performance Gründe natürlich per default über Compiler Direktive aus.

M-Reimer · 15. Dezember 2021

Für den ganzen VDR würde im Prinzip wohl reichen nur den Pointer (Adresse) auszugeben. Könnte zwar theoretisch neu vergeben werden, aber bei überschaubarer Laufzeit wohl unwahrscheinlich. Auswertung dann im Nachgang z.B. mit einem Python-Skript das das Log parst und entsprechend eine Liste aufbaut.

rell · 15. Dezember 2021

Zitat von kfb77

Ich komme mit den "Leck-Detektoren" auch nicht klar. Ich habe bei markad genau so eine Logging Funktion mal eingebaut. Jedes alloc/new wird mit dem Objektnamen in ein Array geschrieben, jedes free/delete löscht den Eintrag aus dem Array. Am Programmende wird das gelogged, was noch im Array drin ist.

War zwar erst mal ein großer Aufwand das überall einzubauen, deckt jetzt aber neue Leaks sofort auf.

Das Ganze ist aus Performance Gründe natürlich per default über Compiler Direktive aus.

Nur weiter gedacht: Der Detektor von oben hängt sich ja zwischen jedes alloc und free, wenn ich es richtig verstanden habe. Könnte man den nicht so anpassen, dass er genau das macht? Stelle ich mir einfacher vor, als zu versuchen, alles im Programm selbst zu suchen? Dh. ein Array mit dem pointer und dem zugewiesenem Speicher füllen und leeren und sich am Ende ansehen, was übrig bleibt? Oder auch mal zwischendurch schauen, was im Array so drin ist?

Gruß

Andreas

rell · 15. Dezember 2021

Der Grund für libleak war bei mir in erster Linie, damit man sieht, was ziemlich häufig und ständig Speicher will. Ob am Ende wirklich geleakt wurde, wollte ich erstmal gar nicht wissen. Wie zuverlässig und aussagekrüftig diese Tools sind, kann ich nicht sagen... ich habe vorher noch nie eins eingesetzt

EDIT: Wenn ich mir den letzten Eintrag aus dem Log z.B. ansehe

Code

callstack[182]: may-leak=635 (7693 bytes)
    expired=635 (7693 bytes), free_expired=0 (0 bytes)
    alloc=635 (7693 bytes), free=0 (0 bytes)
    freed memory live time: min=0 max=0 average=0
    un-freed memory live time: max=4826

lese ich es so, dass hier wohl 7693 bytes an Speicher alloziert wurden, aber am Ende nicht gefree'd wurden?

Das wäre für mich schonmal ein Ansatz zu schauen, ob das wirklich so ist.

EDIT2: Wenn ich dann noch //FcFini(); // older versions of fontconfig are broken - and FcInit() can be called more than oncesehe, sieht das auf den ersten Blick für mich als Laien, oder jemanden, der noch nicht genau in den Code geschaut hat, verdächtig aus :p

M-Reimer · 15. Dezember 2021

Das mit "FcFini" passt tatsächlich so. Fontconfig hält globale Variablen und auch Plugins nutzen fontconfig. Wenn da jeder potentiell dem anderen das Fontconfig "wegräumt" gibt es unkontrolliert Crashes. Nur der VDR dürfte "FcFini" aufrufen, aber ganz am Ende. Also erst dann wenn alle Plugins, ... auch komplett weg sind. Aber auch das ist nun kein kritisches Problem. Hier würde dann eben der Kernel final aufräumen.

mini73 · 16. Dezember 2021

Man kann "new" und "delete" überschreiben und dann eigene Logfunktionen bauen, nichts anderes machen sicherlich die Leck-Detektoren.

Oder man stellt um auf std::unique_ptr bzw. shared_ptr.

https://en.cppreference.com/w/cpp/memory/unique_ptr

https://en.cppreference.com/w/cpp/memory/shared_ptr

rell · 16. Dezember 2021

mini73 "*alloc" und "free" für C und zusätzlich "new" und "delete" für C++ oder werden Konstruktor und Destruktor im Endeffekt auch über alloc/free erfasst?

... bin kein C++'ler

IMHO sollte es nicht so schwer sein, die notwendigen Wrapper zu schreiben und dann kann man auch eine Statistik füllen und abfragen. Per LD_PRELOAD wäre das wohl auch sauber einzubinden. Vielleicht schreibe ich da mal was zusammen...

Gruß

Andreas

mini73 · 16. Dezember 2021

Wenn man nur den vdr betrachtet, kann man ja schon viel über den Präprozessor machen. Aber das wäre dann nicht über LD_PRELOAD machbar.

Wenn du das nur für bestimmte Klassen machen willst, sollte man einfach die entsprechenden Operatoren überladen können.

https://www.geeksforgeeks.org/…ng-new-delete-operator-c/

MarkusE · 16. Dezember 2021

Aber vdr verwendet doch meist malloc und free.

mini73 · 17. Dezember 2021

Zitat von MarkusE

Aber vdr verwendet doch meist malloc und free.

Nicht wirklich - ein kurzes "git grep" zeigt beides in ausrecheinder Menge an...

wirbel · 17. Dezember 2021

Hm.., hilft new und delete zu überschreiben auch bei

class F;

(..)

F Instance;

Oder aber nur bei

F* Instance = new F( /*arglist*/ );

(..)

delete Instance;

kls · 17. Dezember 2021

Nur bei new/delete, denn im ersten Fall wird das Objekt ja auf dem Stack angelegt und kann daher kein Memory-Leak verursachen.

wirbel · 17. Dezember 2021

Danke(!) - manchmal ist man sich solcher 'Nebensachen' nicht so ganz bewußt.

HelmutB · 17. Dezember 2021

Da ich bei meinen Test immer den eitFilter deaktiviere und nur die Events der epg.data einlese habe ich in epg.c immer mehr Informationen daraus übersprungen und nicht in cEvents eingelesen. Schlußendlich habe ich auch die beiden Hashes für Starttime und EventID nicht mehr befüllt und es wurden nur noch (fast) leere Events zu den Schedule-Listen hinzugefügt.

Es hat sich aber auch hier gezeigt, das nach dem Entfernen von fast 50% der Events kein RAM feigegeben wird: Ein Memory-Leak würde ich aber durch die starke Vereinfachung nun mit ziemlicher Sicherheit auch ausschließen.

Vielleicht hat diese "Nichtfreigabe" von eigentlich unbenutzten Speicher auch einen tieferen Sinn:

Der VDR alloziert vermutlich einige Hundert kleine Speicheblöcke pro Minute um sie in diverse Listen zu verarbeiten und anschließend wieder freizugegeben. Es wird sich damit zwangsweise eine starke Fragmentierung im RAM ergeben das zwar viele, aber eher kleine zusammenhängende Bereiche von freiem Speicher enthält.

Möglicherweise hält sich der Speicher-Manager - solange es noch genügend "grossen" freien physischen Speicher gibt - zurück und wartet, ob sich durch kommende free's/delete's mehrere kleine Speicheblöcke zu einem grösseren Vereinen.

Das ist aber nur eine Vermutung.

Ich bin dann auf die Funktion malloc_trim() gestossen, Durch diese wird der Speichermanager veranlasst, den im obersten Bereich des Heap nicht benötigten Speicher sofort freizugegeben.

Ich habe diese Funktion jetzt in den ListGarbageCollector eingebaut und kann beobachten, daß sich seit dem zweiten Transponderdurchlauf der Wert von "RES" ziemlich eingependelt hat und sich nun - ausgehend von ca. 155 MiB - seit ca. 1 Stunde ziemlich Konstant zwischen 251 MiB und 253 MiB bewegt.

Im Anhang der malloc_trim Patch, vielleicht kann noch jemand dieses Verhalten bestätigen.

Zusätzlich auch noch ein Patch der beim Schedule-Cleanup die Anzahl und Veränderung der EPG-Events ins syslog schreibt.

M-Reimer · 18. Dezember 2021

Interessanter Fund. Bedeutet dann auch das man diese Art von "RAM-Verbrauch" dann ignorieren kann wenn der Kernel bei Bedarf diesen Speicher wieder zurückgewinnen kann.

Speicherleck im VDR oder einem Plugin

Jetzt mitmachen!

Teilen