[tvscraper] Fehlende Scrapings

  • Nach...

    Code
    vdr:~# svdrpsend PLUG tvscraper delc 'japan im licht der jahreszeiten'
    220 vdr SVDRP VideoDiskRecorder 2.6.1; Sat Dec 16 22:38:13 2023; UTF-8
    900 1 cache entry/entries deleted
    221 vdr closing connection
    vdr:~# svdrpsend PLUG tvscraper DELS -417481
    220 vdr SVDRP VideoDiskRecorder 2.6.1; Sat Dec 16 22:38:31 2023; UTF-8
    900 0 series entry/entries deleted
    221 vdr closing connection
    vdr:~# systemctl restart vdr && svdrpsend PLUG tvscraper scep

    ...sieht es bei mir leider immer noch aus:

  • Hi,

    im git ist ein update:

    - svdrpsend PLUG tvscraper DELS löscht jetzt vollständiger, also auch die Runtimes

    - Endungen am Titel wie ": 123-3465" werden nun ignoriert

    - Bei der Bewertung der Treffer gibt es einen Bonus wenn in der externen DB Übersetzungen in die Sprache des Senders vorliegen

    Ersteres sollte dazu führen, dass svdrpsend PLUG tvscraper DELS -417481 den gewünschten Effekt hat (s.o.).

    Und der letzte Punkt führt dazu, dass etwas mehr Treffer, die vorher wegen zu geringer Übereinstimmung abgelehnt wurden, jetzt akzeptiert werden. Ich hoffe, dass dass nicht zu zu vielen "false positives" führt.

    Bitte testen.

    ~ Markus

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • > - Endungen am Titel wie ": 123-3465" werden nun ignorier

    Das Debug-Log unten ist so korrekt?

    Also, dass er nach wie vor nach "wild hokkaido!: 2069-097" sucht, es also nicht komplett entfernt?

  • :(

    Wird in diesem Fall nicht entfernt, weil das letzte Zeichen von "wild hokkaido!" ein ! ist. Damit hatte ich nicht gerechnet, ich dachte, die Namen enden mit einem Buchstaben oder einer Zahl. Wie ist der Name in der externen DB?

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • > Wie ist der Name in der externen DB?

    https://www.themoviedb.org/tv/217384-wild-hokkaido

    > - Bei der Bewertung der Treffer gibt es einen Bonus wenn in der externen DB Übersetzungen in die Sprache des Senders vorliegen

    Was ist eigentlich für NHK World-JPN als Sprache hinterlegt?

    Da müsste ja EN hinterlegt sein, ich sehe da aber bei den Einträgen 0,0000 für TranslationAvailable.

    Oder bezieht sich das auf DE als Sprache des VDR?

  • > Was ist eigentlich für NHK World-JPN als Sprache hinterlegt?

    Du kannst in den tvscraper Einstellungen jedem Sender eine Sprache zuweisen

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • > bewertet TranslationAvailable nur den Titel-String oder auch den Handlungs-String?

    Je nach externer db. Bei TMDb genügt es, wenn irgendeine Übersetzung vorliegt. Titel werden oft nicht übersetzt, es wird einfach der Originaltitel verwendet.

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • Im git ist ein Update.

    - Bessere Erkennung von : 324-1525

    - Es wird auch der EPG Titel + Kurztext mit dem Namen des Movies in der externen db verglichen, hilft bei Clint Eastwood - Der Letzte seiner Art

    - Falls bei Movies der EPG Titel mit dem Pattern (../n) endet, wird das bei dem Laufzeitvergleich berücksichtigt. Hilft bei Die Arktis - 66,5 Grad Nord

    ~ Markus

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

  • Noch eine Idee:

    den Scraper konfigurierbar von Adult-Material ausschließen (override.conf?).

    Bzw. das per Default zu deaktivieren.

    Bin gerade über ein Fehlscraping in die Richtung gestolpert - statt einer Soulsängerin gab es einen italienischen Porneaux von 1992.:whistling:

    Edit: muss mich korrigieren - das ist eine FSK16-"Komödie".

    Edited 4 times, last by rüsseltier (December 19, 2023 at 9:32 AM).

  • Hier mal noch ein Fail, den ich mir nicht so recht erklären kann.

    Es scheitert an der Duration (0,0000) - die ist in der API-Ausgabe aber mit 85min runtime vorhanden.

    delc, delm und dels auf die ID wurden alle schon losgelassen.

    Edit: Das ZDF bei der Wiederholung jetzt das EPG aufgefüllt, wird jetzt also gescraped.

    Die Duration ist dabei aber nach wie vor 0.

    Edited 4 times, last by rüsseltier (December 19, 2023 at 3:29 PM).

  • Noch was im Zusammenhang mit dem Scraping von NHK World-JPN:

    Beispiel mit Übersetzung in de und en.

    Trotzdem meint der Scraper, dass TranslationAvailable 0,00000 ist.

    Das Problem zieht sich durchs komplette Programm von NHK.

    Die Eigennamen der Sendungen bleiben in der Übersetzung gleich, aber die Beschreibungen sind übersetzt und sollten für die Bewertung honoriert werden.

    Edited 2 times, last by rüsseltier (December 19, 2023 at 1:48 PM).

  • Ergänzend noch ein weiteres Duration-Problem bei TVDB.

    Duration ist bis runter auf Episoden-Ebene in der DB, Match aber 0,00000

  • svdrpsend plug tvscraper delm 1218646

    hast DU schon gemacht?

    Bei mir sieht das so aus:

    Client1: ASUS P5QC, Dual Core 3G, Cine S2, Ext. Board von TBE, Xubuntu 20.04, VDR 2.6x

    Client2: RPI3

    Server: RPI4, Sundtek SkyTV Dual 2x

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!