[Announce] vdr-plugin-tvscraper 1.1.13

  • Weiters gibt es da immer wieder so fehlgeleitete Aufnahmen:

    Also ein "Babyalarm", der ganz gewiß nicht zu der Gilmore-Girls - Serie gehört,

    oder Sniper - Legacy, der absolut nichts mit SOKO Kitzbühel zu tun hat.


    Mal "ausmisten gehen" :)

  • tvscraper hat die Episoden der Serien falsch zugeordnet.


    Poste doch mal den Pfad einer der Episoden, und die info Datei der Epsisode

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • /srv/vdr/video/Serien/Gilmore_Girls# ls *Baby*

    Eine falsche Aufnahme:

    Babyalarm_-_Eltern_am_Limit:

    2022-09-21.22.13.27-0.rec


    Die info dazu:

    C S19.2E-1-1089-12020 RTLZWEI

    E 4347326 1663791300 3600 50 FF

    T Babyalarm – Eltern am Limit

    S Große Geschwister gehen auf die Barrikaden!

    D Genre: Dokusoap|Kategorie: Serie|Land: D|Jahr: 2020|||Tipp||Der Nachwuchs ist da, aber die Erstgeborenen reagieren nicht immer begeistert auf das neue Geschwisterchen. Flora und Mann David begrüßen Thelma als neues Familienmitglied, aber Aline und der Schlafentzug machen Probleme. 4 Folgen, mittwochs.||Audio: Stereo|Flags: [Neu]||EPG: DVB/TVSP

    G 81

    X 2 03 deu

    X 3 03 deu

    F 25

    P 10

    L 40

    O 4743

    @ <tvscraper><causedBy>Serien~Gilmore Girls~S03E13 - Babyalarm!</causedBy><reason>improve</reason></tvscraper>


    Die entsprechende zur Serie gehörende Aufnahme:

    'S03E13_-_Babyalarm!':

    2022-01-13.11.44.4-0.rec


    und die - hier leider "gestrippte" info (ist mir bei älteren Aufnahmen mal passiert, da mußte ich aus der info.epg2vdr "regenerieren"):

    C SIXX

    T S03E13_-_Babyalarm!

    D GENRE: Familien|CATEGORY: Serie|COUNTRY: USA|| Als Sherry plötzlich in den Venen liegt, bittet sie Rory mit ihr gemeinsam ins Krankenhaus zu fahren und dort als Unterstützung bei ihr zu bleiben. Derweil denkt Lorelai an den Tag zurück, an dem Rory geboren wurde. Rückblicke erzählen die Geschichte der 16-jährigen Lorelai, die herausfindet, dass sie schwanger ist, entscheidet ihren damaligen Freund Christopher nicht aus einem solchen Grund zu heiraten und anschließend ihr Elternhaus verlässt.|Regie: Gail Mancuso|Drehbuch: Amy Sherman-Palladino|Komponist: Sam Phillips|Darsteller:|Scott Patterson (Luke Danes)|Edward Herrmann (Richard Gilmore)|Keiko Agena (Lane Kim)|Melissa McCarthy (Sookie St. James)|Kelly Bishop (Emily Gilmore)|Lauren Graham(Lorelai Gilmore)|Jared Padalecki (Dean Forester)|Milo Ventimiglia (Jess Mariano)|Sean Gunn (Kirk Gleason)


    Eine aktuelle info:

    /srv/vdr/video/Serien/Gilmore_Girls/S02E21_-_Ferngesteuert/2022-09-23.14.07.1-0.rec# cat info

    C C-1537-5-5001 ORF 1 HD

    E 4367095 1663935000 2400 50 18

    T Gilmore Girls

    S Ferngesteuert

    D Genre: Familien|Kategorie: Serie|Land: USA|Jahr: 2002||Sehr empfehlenswert||Lorelais Strebsamkeit hat sich ausgezahlt. Sie hat erfolgreich ihre Ausbildung an der Business School abgeschlossen. Für den Tag der Diplomübergabe lädt Rory heimlich Richard und Emily ein. Lorelai freut sich sehr über dieAnwesenheit ihrer Eltern. Sie ist aber auch verstört, weil Rory an diesem wichtigen Tag fehlt. Sie ist nach New York gefahren, um Jess zu treffen. (Senderinfo)||Altersempfehlung: ab 6||Darsteller: Lauren Graham (Lorelai Gilmore), Alexis Bledel (Lorelai Leigh „Rory“ Gilmore), Melissa McCarthy (Sookie St. James), Keiko Agena (Lane Kim), Yanic Truesdale (Michel Gerard), Scott Patterson (Luke Danes), Kelly Bishop (Emily Gilmore), Edward Herrmann (Richard Gilmore), Jared Padalecki (Dean Forester), Liza Weil (Paris Geller), Milo Ventimiglia (Jess Mariano), David Sutcliffe (Christopher Hayden)||Regie: Daniel Palladino|Audio: Stereo||Serie: Gilmore Girls|Folgentitel: Ferngesteuert|Staffel: 2|Staffelfolge: 21|Staffelfolgen: 22|Folge: 42||EPG: DVB/TVSP

    G 32

    R 6

    X 5 0B deu

    X 2 05 deu

    X 2 05 eng

    F 50

    P 35

    L 50

    O 1093

    @ <epgsearch><channel>1 - ORF 1 HD</channel><searchtimer>Gilmore Girls</searchtimer><start>1663934820</start><stop>1663938000</stop><s-id>37</s-id><eventid>4263019</eventid></epgsearch



    Jetzt bei der Durchsicht der anderen "Irrläufer" in der Timerliste fällt mir auf, daß die alle solche "verkürzte" Einträge betreffen.

    Dumm das - woran hängt der tvscraper die Serien-Information?

    Hätte da ja sowieso noch das Problem, daß der vom tvscraper generierte Titel nicht die Serie-Episode-Kennung enthält ...

    Leider kann ich nicht "collection" enabled lassen, und gleichzeitig die "improve"-Timer deaktivieren. Auch kann ich "Serien" deaktivieren, aber sämtliche Unterverzeichnisse sind trotzdem noch in der Liste und müßten einzeln abgewählt werden. Vermutlich auch dann wieder, wenn eine neue angelegt wird.

    Einmal editiert, zuletzt von wmautner ()

  • Hi,


    Bei Serien sollte:


    T Name der Serie

    S Name der Episode
    Name des Verzeichnisses unter *.rec: "Name der Episode"


    Mit kleinen Abweichungen kommt tvscraper zurecht, z.B. wenn

    Name des Verzeichnisses unter *.rec: "Name der Serie"

    ist.


    Wenn in

    Name des Verzeichnisses unter *.rec: "S03E13_-_Babyalarm"

    oder

    Name des Verzeichnisses unter *.rec: "S02E21_-_Ferngesteuert"


    steht, führt das zu falschen Ergebnissen :( .tvscraper sucht dann nach einer Serie, die "S02E21_-_Ferngesteuert" heißt. Und nach einem Spielfilm, der "S02E21_-_Ferngesteuert" heißt.


    Kannst du die Umbenennen, so dass z.B.:

    Name des Verzeichnisses unter *.rec: "Babyalarm"

    ist?

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • Naja, der Sinn der SxxEyy-Nummerierung ist, daß die Sortierung nach Name der Reihenfolge entspricht, und fehlende oder doppelte Einträge unabhängig vom Aufnahmedatum sofort zu erkennen sind. War eines der "advanced"-Features von epgsearch und den uservars.

    Das möchte ich nicht wieder aufgeben ...

  • Naja, der Sinn der SxxEyy-Nummerierung ist, daß die Sortierung nach Name der Reihenfolge entspricht, und fehlende oder doppelte Einträge unabhängig vom Aufnahmedatum sofort zu erkennen sind. War eines der "advanced"-Features von epgsearch und den uservars.

    Das möchte ich nicht wieder aufgeben ...


    Ich nummeriere bei Serien-Aufnahmen auch, allerdings nur mit 01_,02_...

    Es gibt einige Serien, da stört es den Scraper nicht, aber es gibt auch andere, da passt es gar nicht.

    Aber ob es an der Nummerierung liegt?



    Danke MarkusE für die Erklärung.


    Ich würde gerne meine Aufnahmen so anpassen, dass der Scraper die Aufnahme eindeutig erkennt.

    Denn den Scraper anzupassen, dass er alle Aufnahme immer fehlerfrei erkennt, halte ich für extrem aufwendig.

    Außer Du siehst Potential die Scraper-Ergebnisse zu verbessern, dann könnten wir, wie schon mal angedacht, die Fehler in einem anderen Thread sammeln.


    Kannst Du anhand von den Daten auf der TMDB-Website sagen, was im Pfad und der Info stehen müsste?


    z.B. von der Serie: West of Liberty


    Ich habe da schon mit dem Pfad und der info etwas experimentiert, aber keine durchweg richtige Erkennung der Serie hin bekommen.

    Die Serie habe ich mir aus der Mediathek geholt und versucht die info passend zu machen, damit Scraper auch die Episoden richtig erkennt.


    Pfad:

    Code
    vdr ~ # find /video/videos/_West_of_Liberty -name info 
    /video/videos/_West_of_Liberty/West_of_Liberty_(1)/2019-10-29.12.27.3-1.rec/info
    /video/videos/_West_of_Liberty/West_of_Liberty_(6)/2019-10-29.15.02.3-1.rec/info
    /video/videos/_West_of_Liberty/West_of_Liberty_(5)/2019-10-29.15.02.3-1.rec/info
    /video/videos/_West_of_Liberty/West_of_Liberty_(4)/2019-10-29.13.51.3-1.rec/info
    /video/videos/_West_of_Liberty/West_of_Liberty_(3)/2019-10-29.13.38.3-1.rec/info
    /video/videos/_West_of_Liberty/West_of_Liberty_(2)/2019-10-29.12.48.3-1.rec/info

    info:


    Gruß und Danke

    Heiko

    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

  • Hi,


    Für Serien verwende ich TheTVDB.

    Die Episodennamen für West of Liberty stehen hier: https://thetvdb.com/series/wes…iberty/seasons/official/1

    Die Episodennamen sich hier unschön, z.B. "Episode 1".


    Zur sicheren Erkennung der Episode also das S Feld in der info Datei ändern, z.B auf Episode 1

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • Für Serien verwende ich TheTVDB.

    Die Episodennamen für West of Liberty stehen hier: https://thetvdb.com/series/wes…iberty/seasons/official/1

    Die Episodennamen sich hier unschön, z.B. "Episode 1".


    Zur sicheren Erkennung der Episode also das S Feld in der info Datei ändern, z.B auf Episode 1


    Das habe ich jetzt mal in der info eingetragen, bekomme aber leider nach Neustart und dem scrapen immer noch bei jeder Episode die Folge 1 angezeigt.


    Das log zeigt Folgendes:



    Die "match"-Einträge wie hier beschrieben, kommen aber nicht.

    Muss ich erst noch die Datenbank oder die scraper-Dateien aus den Verzeichnissen löschen?


    Die info sieht jetzt so aus:


    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

  • Warum nimmt der TVScraper die Namen nicht aus der info-Datei vom VDR, oder vom VDR direkt, falls unterstützt. In der Info sind Die EyySxx nicht im Namen drin. Das betrift nur die Ordnernamen auf der Platte

  • heifisch,


    gebe doch bitte mal in der Konsole ein:


    sqlite3 /dev/shm/tvscraper2.db

    Und dann, beim sqlite prompt:

    select season_number, episode_number, episode_absolute_number, episode_name from tv_s_e where tv_id = -364707;


    und poste den output.

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • sqlite3 /dev/shm/tvscraper2.db

    Und dann, beim sqlite prompt:

    select season_number, episode_number, episode_absolute_number, episode_name from tv_s_e where tv_id = -364707;

    Code
    sqlite> select season_number, episode_number, episode_absolute_number, episode_name from tv_s_e where tv_id = -364707;
    1|1|0|Folge 1
    1|2|0|Folge 2
    1|3|0|Folge 3
    1|4|0|Folge 4
    1|5|0|Folge 5
    1|6|0|Folge 6

    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

  • Nachdem ich in der Datenbank mal die Einträge geändert habe, stimmen die tvscraper-Daten und die Episoden werden korrekt angezeigt:



    Also wie es aussieht, wurden die Einträge in der Datenbank nicht durch die Änderungen der info-Datei ersetzt.

    "Folge *" hatte ich mal bei einem älteren Test in der info stehen...

    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

  • Hallo Heiko,


    Ich habe das hier mal nachgebaut, mit "Deinen" DB Einträgen (also "Folge 6", ...), und Deiner Info Datei.

    Code
    Sep 26 22:03:08 vdr1 vdr: [24419] tvscraper: Scrap recording "/video/_West_of_Liberty/West_of_Liberty_(6)/2019-10-29.15.02.3-1.rec"
    Sep 26 22:03:08 vdr1 vdr: [24419] tvscraper: Scrap event: search string "west of liberty", title "West of Liberty (6)", start time: 2019-10-29
     15:02:24
    Sep 26 22:03:08 vdr1 vdr: [24419] tvscraper: cSearchEventOrRec::Store StoreSeriesJson, movieOrTv.id -364707
    Sep 26 22:03:08 vdr1 vdr: [24419] tvscraper: found TVtv cache tv "west of liberty", episode "Episode 6" , id -364707 season 1 episode 6


    Er findet also die korrekte Episode. Warum: Es gibt keinen Match das Namens der Episode ("Folge 6" != "Episode 6"). Dann gibt es ein Fallback, und tvscraper nimmt an, dass die Zahl in Klammern hinter dem Titel die Nummer der Episode ist. Was in diesem Fall stimmt, daher findet er die korrekte Episode.

    Warum das bei Dir nicht funktioniert, ist mir unklar.


    Es ist übrigens schwieriger, die korrekten Episodennamen aus TheTVDB zu bekommen, als ich dachte. Dazu musst Du Dich bei TheTVDB (kostenlos) registrieren, und in deinem Profil "Deutsch" als bevorzugte Sprache angeben. Dann zeigt TheTVDB auch die deutschen Episodennamen an, und das ist "Folge 1", "Folge 2", ...

    Die Daten in der Datenbank kommen aus TheTVDB, und sind die deutschen Name der Folgen ...

    Sorry, das war mir erst nicht klar, "Episode 1" hörte sich so deutsch an :( .


    ~ Markus

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x


  • Die Daten in der Datenbank kommen aus TheTVDB, und sind die deutschen Name der Folgen ...


    Ok, da habe ich es hier genau falsch rum gemacht.

    Ich schaue mir das Ganze noch mal an.


    Danke!

    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

  • Hi,


    zu dem Thema: was sollte als Suchstring verwendet werden?

    • Option A: T Feld in info Datei. Vorteil: Kommt aus dem EPG, und kann nur relativ aufwändig (Editieren der info Datei & VDR Neustart) verändert werden. Nachteil: Die EPG Daten stimmen manchmal nicht mit den Daten der externen Datenbanken überein. Dann findet tvscraper nichts/oder etwas falsches
    • Option B: Name der Aufzeichnung. Vorteil: Wenn die EPG Daten nicht mit den Daten der externen Datenbanken übereinstimmen, kann das recht leicht geändert werden

    Aus meiner Sicht überwiegen die Vorteile von B, daher möchte ich dabei bleiben.

    vdr-plugin-live kann die Episoden sortieren, und richtig darstellen. VDR kann das nicht :( . Daher verstehe ich Euren Wunsch, durch Umbenennen der Folgen die gewünschte Sortierreihenfolge zu erreichen.


    Ich könnte mir vorstellen, dass wir uns auf ein Zeichen einigen, das normalerweise in den Nahmen nicht verwendet wird. Z.b. "§". Und tvscraper dann alles, was im Namen vor § steht, ignoriert.


    Wir könnten auch unsere skin Entwickler bitten, das in den skin einzubauen. Dann müssten wir die Namen der Aufzeichnungen nicht für Episodennummern verwenden.


    Was meint Ihr?


    ~ Markus

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • sqlite3 /dev/shm/tvscraper2.db

    Und dann, beim sqlite prompt:

    select season_number, episode_number, episode_absolute_number, episode_name from tv_s_e where tv_id = -364707;


    Wenn man die Datenbank direkt mit einem String wie "Der große Eisen" abfragen möchte, könnte man das so machen?


    Code
    sqlite3 /dev/shm/tvscraper2.db
    
    SELECT DISTINCT t1.movie_name_cache, t2.season_number, t2.episode_number, t2.episode_absolute_number, t2.episode_name FROM cache AS t1,tv_s_e AS t2 WHERE t2.tv_id=t1.movie_tv_id AND t1.movie_name_cache LIKE "%Der große Eisen%";
    
    der große eisenbahnraub 1963|1|1|0|Die Geschichte der Räuber
    der große eisenbahnraub 1963|1|2|0|Die Geschichte der Polizisten


    Hier habe ich noch einen Duplikatsfehler, dem ich nachgehen möchte... aber jetzt weiß ich ja, wie ich da ran gehen muss

    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

    Einmal editiert, zuletzt von heifisch ()

  • vdr-plugin-live kann die Episoden sortieren, und richtig darstellen.


    vdr-plugin-live kann nach Episoden sortieren?

    Was für Voraussetzungen sind dafür nötig?


    Ich dachte, live sortiert nur nach Aufnahme-Datum oder nach Aufnahme-Namen...

    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

  • Bei mir ist die Trennung in den Dateinamen so: S03E16_-_Die_Verkupplung

    Also underscore"-"underscore.

    Sowas kommt am Beginn eines normalen Titels nicht vor, schon gar nicht mit einer Ziffer davor.

    Das vorgeschlagene Paragraphenzeichen wäre sicher eine erwägenswerte Alternative, v.a. hat das keine Sonderfunktion in der Shell oder muß bei Samba-Freigaben auch nicht umgemappt werden.


    Liebe Grüße aus Wien!

  • Es können auch Fehler bei der Übersetzung in der TheTVDB vorhanden sein, die zu einer Fehlerkennung führen.

    So gefunden hier in Deutsch (Teiil 1):


    https://thetvdb.com/series/trackers-za/episodes/7770599


    Code
    sqlite> SELECT DISTINCT t1.movie_name_cache, t2.season_number, t2.episode_number, t2.episode_absolute_number, t2.episode_name FROM cache AS t1,tv_s_e AS t2 WHERE t2.tv_id=t1.movie_tv_id AND t1.movie_name_cache LIKE "%Trackers%";
    trackers - rote spur|1|1|0|Teiil 1
    trackers - rote spur|1|2|0|Teil 2
    trackers - rote spur|1|3|0|Teil 3
    trackers - rote spur|1|4|0|Teil 4
    trackers - rote spur|1|5|0|Teil 5


    Was bei diesem Beispiel für eine richtige Erkennung erschwerend hinzu kommt, in der TheTVDB steht es mit 5 Episoden, 3sat hat es aber in 3 Episoden ausgestrahlt.

    Gentoo Linux ~ VDR 2.6.6 ~ DD Octopus NET V2 S2 Max - SAT>IP ~ LENOVO ThinkServer TS200V ~ Intel(R) Core(TM) i5 CPU680@3.60GHz ~ 16GB RAM ~ NVIDIA T400

    Einmal editiert, zuletzt von heifisch ()

  • Dann werfe ich mal meine Benennungsregel ein:


    Bei mir sind die SxxExx am Ende der Folge

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!