[epgd/epg2vdr/scraper2vdr] ein paar Serien haben keine Zusatzinformationen im EPG/Aufnahmen

  • Hallo,


    nach der Umstellung auf Server/Client Betrieb von epgd ist mir bei 3 aktuellen Suchtimern aufgefallen, dass zu diesen Serien keine Zusatzinformationen im EPG angezeigt werden, ebenso die Aufnahmen dazu.

    Das betrifft Grey's Anatomy, Seattle Firefighter und Marvel's Runaways.

    Bei Grey's Anatomy (73762) und Marvel's Runaways (332027) sind nicht einmal die Serien-IDs in /var/cache/vdr/epgimages/series/ vorhanden.

    Für Seattle Firefighter existiert zwar der Ordner 341852 mit Inhalt von Bildern, aber im EPG und bei den Aufnahmen kommt dabei nichts an.

    Bei beiden gestrigen Aufnahmen kam das im Log:

    Code
    Apr 17 20:11:20 server epgd: Found new recording 'Grey's Anatomy – Die jungen Ärzte'/'Engel des Alltags'
    Apr 17 20:11:20 server epgd: SCRAP: Searching 'Grey's Anatomy – Die jungen Ärzte' as series in database
    Apr 17 20:11:20 server epgd: SCRAP: Nothing found in db, searching 'Grey's Anatomy – Die jungen Ärzte' as series online
    Apr 17 20:11:21 server epgd: SCRAP: Recording NOT successfully scraped 'Grey's Anatomy – Die jungen Ärzte'
    
    Apr 17 21:20:40 server epgd: Found new recording 'Seattle Firefighters – Die jungen Helden'/'Verlorenes Vertrauen'
    Apr 17 21:20:40 server epgd: SCRAP: Searching 'Seattle Firefighters – Die jungen Helden' as series in database
    Apr 17 21:20:40 server epgd: SCRAP: Nothing found in db, searching 'Seattle Firefighters – Die jungen Helden' as series online
    Apr 17 21:20:40 server epgd: SCRAP: Recording NOT successfully scraped 'Seattle Firefighters – Die jungen Helden'

    Warum bringt auch die Onlinesuche nichts, wenn es schon nicht in der DB ist?


    bei allen anderen aktuellen Seirenaufnahmen passt alles.


    Jemand eine Idee?



    Danke

    Markus

  • bei allen anderen aktuellen Seirenaufnahmen passt alles.

    Haben die auch mit Bindestrichen abgetrennte deutsche Subtitel?

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • Also Marvel's Runaway hat ja keinen Bindestrich. Bei der und bei Grey's Anatomy habe ich eher den ' in Verdacht.

    Mit Bindestrich meinst Du sicherlich nicht den Subtitle, sondern den im Serientitel.


    Zumindest Hawaii Five-0 und 9-1-1 haben auch einen Bindestrich im Titel. Bei ersterer weiß ich das alles passt, EPG und Aufnahmen. Zweitere kommt gerade nicht, also nicht im EPG. bei den Aufnhamen müsste nachschauen, aber ich meine ja, zusätzlich Bilder sind vorhanden.

    Obwohl das bei diesen beiden Serien irgendwie kurze Bindestriche sind.

    Bei Game of Thrones – Das Lied von Eis und Feuer ist mir auch grad fehlendes Zusatzmaterial aufgefallen. Würde wieder für den langen Bindestrich sprechen.


    Nur dann müssten doch noch einige mehr das Problem haben.

  • Mit Bindestrich meinst Du sicherlich nicht den Subtitle, sondern den im Serientitel.

    Ich gebe es zu, es ist ein Halbgeviertstrich, kein Bindestrich... - ich meine den Käse, den die da an den eigentlichen Titel hängen – Die jungen Ärzte, – Die jungen Helden usw. Wenn man mit TheTVDB nach solchen Serien sucht, kommt dabei nichts vernünftiges heraus. Für die Aufnahmen könnte man mal mit einer scrapinfo-Datei mit der Serien-ID (und ggf. Episoden-ID) arbeiten, also z.B. für Grey's Anatomy-Folge S15E21 ("Good Shepherd"):

    Code
    series
    id = 73762
    episode = 7103498

    epgd gleicht den Titel und Folgeninfos soweit ich weiß erst mal mit den eplist-Dateien ab, für Grey's Anatomy sind die Daten für die 15. Staffel aber noch unvollständig: https://www.eplists.de/eplist.…w&file=Grey%27s%20Anatomy und für Seattle Firefighters fehlen Episoden der zweiten Staffel: https://www.eplists.de/eplist.…-%20Die%20jungen%20Helden, Marvel's Runway hat noch gar keine Einträge.

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • Die Folgen- und Staffelnummern passen. Darum geht es ja auch nicht. eplists ist auchnur für die Staffelnummern usw. zuständig.

    Es geht schon um die erweiterten Bilder und banner von thetvdb.com.

    Das das bei den beschriebenen Serien aktuell nicht geht, ist aber neu. Bisher hatten alle angemerkten Serien die Scrape-Informationen.

    Das Angängsel machen nur die deutschen Sender, auf ORF heisst die Serie einfach nur "Grey's Anatomy" bzw. die andere Serie "Station 19". Aber auch auf ORF gibt es keine Scrape-Informationen zu Grey's Anatomy. Station 19 dagegen schon, erklärt auch den vorhandenen Serien-Ordner

    Hier muss also noch was anderes die Ursache sein. Der Halbgeviertstrich alleine kann es auch nicht sein, da zb. "Greyzone – No Way Out" mit alle Zusatzinformationen versehen ist.


    Evtl. schauen ja mal einer der Macher drüber, wie ckone oder horchi.

  • Hast du bei alles Sendungen denn Serienauflösung von eplist?


    ohne die Auflösung holt er nix aus der DB

    CKone: yavdr-ansible/18.04 LTS/2.4.1/kodi18 auf Intel DH67BL, Intel Celeron G540, 2x 2GB Kingston DDR3, Zotac GT630 1GB, S2-1600, Ocz Agility 3 60GB, LG GH24NS DVD, 15.6" Selbstbau TFT, Harmony 665, CIR Selbstbau - das Ganze im Silverstone SST-SG03B
    CKtwo: yavdr-ansible/18.04 LTS/2.4.1/kodi18 auf Intel DH67BL, Intel Celeron G1610, 2x 2GB Corsair DDR3, Zotac GT630 1GB, TT S2-1600, Ocz Vertex 2 50 GB, 92 Kanal Seduatmo, Harmony 665, atric USB
    CKthree: yavdr-ansible/22.04 LTS/2.6.1/kodi19.3 auf Intel NUC, Celeron J4005, UHD Graphics 600, 4GB Crucial DDR4, Ocz Vertex2 50 GB, Harmony 350

    PowerEdge: Ubuntu Server 16.04 LTS / VDR 2.4.1 auf Dell PowerEdge T20, Xeon E3-1225 v3, 16GB ECC DDR3, 2x Cine S2 V6 mit Duoflex, Samsung 840 EVO 120GB, 3x WD White WD80EZAZ 8TB in SW Raid5



  • Verstehe ich nicht? Was heisst Serienauflösung?

    Habe nichts geändert an meinen Einstellungen, nur das epgd jetzt auf einem extra Rechner läuft.

    Was hat denn eplists mit dem Scrapen von thetvdb.com zu tun?

    Titel und Folgentitel holt doch der epgd von tvm/tvsp. Anhand dieser Daten wird doch in thetvdb.com gescraped.

    Ich könnte doch auch eplists in der epgd.conf deaktivieren - das sollte doch nicht irgendwas mit den gescrapten Daten zu tun haben?

  • nein es wird afaik nur gescraped mit den Daten aus eplist wenn die Episode aufgelöst wurde

    CKone: yavdr-ansible/18.04 LTS/2.4.1/kodi18 auf Intel DH67BL, Intel Celeron G540, 2x 2GB Kingston DDR3, Zotac GT630 1GB, S2-1600, Ocz Agility 3 60GB, LG GH24NS DVD, 15.6" Selbstbau TFT, Harmony 665, CIR Selbstbau - das Ganze im Silverstone SST-SG03B
    CKtwo: yavdr-ansible/18.04 LTS/2.4.1/kodi18 auf Intel DH67BL, Intel Celeron G1610, 2x 2GB Corsair DDR3, Zotac GT630 1GB, TT S2-1600, Ocz Vertex 2 50 GB, 92 Kanal Seduatmo, Harmony 665, atric USB
    CKthree: yavdr-ansible/22.04 LTS/2.6.1/kodi19.3 auf Intel NUC, Celeron J4005, UHD Graphics 600, 4GB Crucial DDR4, Ocz Vertex2 50 GB, Harmony 350

    PowerEdge: Ubuntu Server 16.04 LTS / VDR 2.4.1 auf Dell PowerEdge T20, Xeon E3-1225 v3, 16GB ECC DDR3, 2x Cine S2 V6 mit Duoflex, Samsung 840 EVO 120GB, 3x WD White WD80EZAZ 8TB in SW Raid5



  • Was hat denn eplists mit dem Scrapen von thetvdb.com zu tun?

    IIRC wird u.a. die Titel-Information anhand des von eplist genutzten Titel umgebogen (also z.B. von "Grey's Anatomy – Die jungen Ärzte" auf "Grey's Anatomy" herunter gebrochen) und dann brauchen epgd bzw. scraper2vdr die Serien-ID und Episoden-ID, um sinnvolle Daten herunterladen zu können - denn über die API nach dem vom EPG genutzten Titel zu suchen bringt in dem Fall keine eindeutigen Treffer.

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • ich dachte immer, das eine hat mit dem anderen nichts zu tun. die zusätzlichen bilder von schauspielern und sonstige informationen aus thetvdb.com sind doch unabhängig von staffel/folgen-nummern.

    frage warum ist das an eplists gekoppelt. das möchte ich ja nur für die nummerierung meiner aufnahmen.

    erweiterte epg-informationen anhand von bildern wäre doch bei allen epgeinträgen schön zu haben, ohne dass ich die serie bisher aufgezeichnet habe, oder das sie jemand in eplists eingetragen hat.

    bei filmen sind diese informationen auch immer gescraped über das vorhandene epg.


    unabhängig davon, werden grey's anatomy und seattle firefighter ordentlich aufgelöst und mit nummern versehen, schon immer. irgendwann waren die bilder nicht mehr da.

    ich meine auch, dass es bei marvel's runaways mal bilder gab, obwohl es keinen eintrag in der eplists dazu gibt.


    Code
    Apr 17 20:11:20 server epgd: Found new recording 'Grey's Anatomy – Die jungen Ärzte'/'Engel des Alltags'
    Apr 17 20:11:20 server epgd: SCRAP: Searching 'Grey's Anatomy – Die jungen Ärzte' as series in database
    Apr 17 20:11:20 server epgd: SCRAP: Nothing found in db, searching 'Grey's Anatomy – Die jungen Ärzte' as series online
    Apr 17 20:11:21 server epgd: SCRAP: Recording NOT successfully scraped 'Grey's Anatomy – Die jungen Ärzte'


    Wenn ich mir das Log aber so anschaue, wird ja online auch noch nachgesehen, wenn nichts in der DB ist. Aber auch das schlägt fehl.

    Und es ist ja noch nicht einmal in die DB gelangt. Das ist ja schon das Problem, er versucht ja was zu holen.

  • Wenn ist nur "Grey's Anatomy" in der Datenbank (müsstest du finden können, wenn du dir die Tabellen ansiehst) - für "Grey's Anatomy – Die jungen Ärzte" gibt es laut Log keinen Treffer. Dann sucht er online, also fragt also thetvdb.com nach "Grey's Anatomy – Die jungen Ärzte", was ebenfalls keinen Treffer liefert. Wenn es einen passenden eplist-Eintrag gäbe, dann sollte er als Serientitel "Grey's Anatomy" gesetzt haben und der Titel wäre sowohl über die Datenbank als auch bei der direkten Suche online findbar.

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • IIRC wird u.a. die Titel-Information anhand des von eplist genutzten Titel umgebogen (also z.B. von "Grey's Anatomy – Die jungen Ärzte" auf "Grey's Anatomy" herunter gebrochen) und dann brauchen epgd bzw. scraper2vdr die Serien-ID und Episoden-ID, um sinnvolle Daten herunterladen zu können - denn über die API nach dem vom EPG genutzten Titel zu suchen bringt in dem Fall keine eindeutigen Treffer.

    OK. Aber wo kommt denn die ID her? Die ist ja in eplists nicht enthalten.

    Bei Movies klappt es ja auch angand des Titels (bis halt auf ein paar Ausnahmen).

  • OK. Aber wo kommt denn die ID her? Die ist ja in eplists nicht enthalten.

    Die wird anhand des mit Hilfe von eplist normierten Titels gesucht. Bei Filmen passiert das genauso über den Titel, aber nicht über https://www.thetvdb.com/, sondern über https://www.themoviedb.org/

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

    Einmal editiert, zuletzt von seahawk1986 ()

  • Zu Grey's Anatomy gibt es doch einen passenden eplists-Eintrag.

    Und die Aufnahmen werden auch nur unter "Grey's Anatomy" abgelegt. Also mit dem Kurztitel aus der eplists.

    Aber eben auch das EPG auf ORF hat keine zusätzlichen Bilder, und dort heißt der Titel korrekt ohne den "Bindestrich".

  • Die wird anhand des mit Hilfe von eplist normierten Titels gesucht. Bei Filmen passiert das genauso, aber nicht über https://www.thetvdb.com/, sondern über https://www.themoviedb.org/

    OK. Aber bei Filmen wird ja direkt nach dem Titel gesucht, ohne diesen Zwischenschritt eplists.

    Soviel Serien dürften es doch gar nicht sein, die "normiert" werden müssten, um sie zu finden. Bin zwar kein Programmierer, aber das könnte man doch bestimmt ohne den Umweg machen.


    Wieder was dazu gelernt. Ich dachte eplists ist "nur" für die Aufnahmen, um diese ordentlich zu benennen.

    Was wird denn alles gescraped, wenn eine Datenbank neu aufgebaut wird? Das sind ja massig Daten, die müssen sich doch am EPG orientieren.


    Nichtsdestotrotz bekomme ich bei Grey's Anatomy und Seattle Firefighters nix rein, Obwohl das mal ging und ich eplists dafür verwende und auch alles aufgelöst wird.

  • Soviel Serien dürften es doch gar nicht sein, die "normiert" werden müssten, um sie zu finden. Bin zwar kein Programmierer, aber das könnte man doch bestimmt ohne den Umweg machen.

    Natürlich kannst du im Fehlerfall (also keine Treffer bei einer Suche) anfangen am Titelstring herumzuschnippeln, aber das führt zu zusätzlichen Anfragen an die DB-Server und die Zuordnung ist dann nicht zwingend eindeutig.


    Die eplist-Dateien lassen sich vergleichsweise einfach herunterladen und aktuell halten und mit einer Datei pro Serie lassen sich die Zuordnung der Staffel- und Episodennummern danach ohne zusätzliche online-Abfragen umsetzen.

    Der Zugriff auf die TheTVDB-API ist wesentlich aufwendiger (die Dokumentation für die alte TheTVDB-API V1, die von tvscraper/epgd genutzt wird, ist mittlerweile nicht mehr verfügbar und die V2 API hat immer noch Kinderkrankheiten - und irgendwann muss epgd darauf angepasst werden, wenn die V1 API abgeschaltet wird).


    Statt lange herumzureden könnte man ja einfach mal die fehlenden Episodeninfos für die betroffenen Serien bei eplists.de ergänzen und schauen, was dann nach dem nächsten Update von epgd passiert.

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • Ja, schon klar.


    Aber nochmal, für Grey's Anatomay und Seattlle Firefighter sind alle Episodennamen der bisherigen Aufzeichnungen drin.

    Die Aufnahmen wurden schon korrekt benannt und abgespeichert. Daran liegt es also nicht.

    Und auch alte Folgen, die noch laufen, wo die Informationen definitiv auch in eplists verfügbar sind, haben keine gescrapten Informationen.

  • nein es wird afaik nur gescraped mit den Daten aus eplist wenn die Episode aufgelöst wurde

    ich habe hier aber eine serie im epg gefunden, die es nicht in eplist gibt (also auch keine episodenauflösung), welche aber gescrapte informationen in form von schauspilelerbildern und season-poster hat. sogar link zu thetvdb.com

    "Die Pest" auf Sky Atlantic HD

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!