Wie können EPG-Daten polnischer Sender richtig angezeigt werden?

  • Hallo,


    ich habe VDR 2.0.3 und die speziellen polnischen Buchstaben im EPG von polnischen Sendern werden nicht richtig angezeigt. Hier ein Beispiel:


    Bulionerzy
    Damian - przekonany, Чze jego sЮasiad Piotr jest maklerem - prosi go o zainwestowanie w jego imieniu duЧzej sumy pieniЮedzy. ChoТc Nowik nie ma pojЮecia o gieјdzie, postanawia zrobiТc wszystko, by nie zawieТsТc znajomego.


    Ich nehme an, dass die richtige Codierung für den Zeichensatz der jeweiligen EPG-Daten eingestellt werden muss.


    Wie mache ich das?


    Gruß


    Paul

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Eine Idee habe ich grundsätzlich schon.
    Zu erstmal bedeuten falsche Zeichen, dass der Sender einen anderen Zeichensatz über trägt, als er vorgibt.


    Das kann man mit den Charset Override fixen. Ungünstig daran ist aber, dass man es nicht senderspezifisch setzten kann. Man hat es also für eine Gruppe von Sendern repariert und gleichzeitig eine andere Gruppe zerstört.


    Genauer funktioniert das mit dem epgfixer. Da werde ich für einige deutsche Sender demnächst mal eine Conf posten.


    Gesendet von meinem Nexus 5 mit Tapatalk

  • Danke für die Antwort!


    Ich werde mir epgfixer mal anschauen.

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Da werde ich für einige deutsche Sender demnächst mal eine Conf posten.

    Hallo Copperhead,


    Schon lange her, Problem leider noch nicht gelöst, deshalb frage ich: Wo finde ich Configs für das epgfixer-Plugin?


    Gruß, Paul

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Schon lange her, Problem leider noch nicht gelöst, deshalb frage ich: Wo finde ich Configs für das epgfixer-Plugin?

    Nirgends. Weil ich sie nie veröffentlicht habe.
    Notwendig ist es bei den meisten Kanälen auch nicht mehr.


    Das hier habe ich noch in der Config stehen.

    Code
    # Anixe
    S19.2E-1-1053-21100,S19.2E-133-5-764:title=m/^(?<title>.*)( - .*?) - (?<shorttext>.*)$/
    # ATV
    S19.2E-1-1003-13228,S19.2E-1-1117-13012,S19.2E-1-1003-13223:shorttext=m/^(?<shorttext>.*), Folge [0-9]+$/


    Das sind allerdings Regexp-Anpassungen. Für die ganzen Sky Sender wäre es viel zu aufwändig epgfixer Regeln zu bauen.
    Da tut das Charset-Override des VDRs schon alles Nötige.

  • Danke für die Rückmeldung!

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Hallo,
    Ich nehme an, dass die richtige Codierung für den Zeichensatz der jeweiligen EPG-Daten eingestellt werden muss.


    Nein, so herum ist das falsch.
    Die Angabe der Kodierung wird in den DVB Daten selbst mitgeliefert, da nur der Sender eines Textes weiß welchen Zeichensatz er beim Senden benutzt hat (welche byte sequenz welchem Schriftzeichen zugeordnet ist).
    Alles was die Anwendung auf der Empfängerseite noch tun muss, ist die im Text signalisierte Codierung in den Zeichensatz des Empfängers umzusetzen. Die Kodierung darf bei Texten in den DVB-Daten beliebig oft wechseln.


    Sender (Text + Angabe des verwendeten Zeichensatzes) -> Übertragung -> (Sende-Zeichensatz -> Empfänger-Zeichensatz)


    Gesendet wird in folgenden Zeichensätzen
    ISO/IEC 6937 + Euro, ISO/EN8859-1..15, ISO/IEC 10646, KSX1001-2004, GB-2312-1980, subset of ISO/IEC 10646 als UTF8 oder Big5
    Wird keine Kodierung angegeben, so gilt ISO/IEC 6937 + Euro als vereinbart.


    Wenn das nicht korrekt umgesetzt wird, wird entweder vom Sender die flasche Kodierung mitgesendet, oder auf der Empfängerseite geht das Umkodieren schief.

  • Hallo wirbel,


    danke für die Erklärung. Leider ist Charset Override beim VDR nur global für einen Zeichensatz einzustellen. Override müsste für jeden Sender individuell zu aktivieren sein.


    Gruß, Paul

    Server: Raspberry Pi, Acer Aspire easyStore H340, DIGIBIT R1 SAT>IP

    Clients: Hauppauge MediaMVP, Raspberry Pi mit Vomp-Client und SAT>IP, BananaPi Pro, Mele M5


  • Hallo wirbel,


    danke für die Erklärung. Leider ist Charset Override beim VDR nur global für einen Zeichensatz einzustellen. Override müsste für jeden Sender individuell zu aktivieren sein.


    Gruß, Paul


    Wozu? Was bringt das?


    Wenn in den Daten vom Sender <XYZ> ein Text in iso8859-1 kodiert und der nächste Text dann iso8859-9 kodiert ist,
    dann wird mit solchen falschen Annahmen wieder einer von beiden Texten falsch dekodiert.
    Die Spec sagt dazu..


    Code
    If the first byte of the text field has a value in the range "0x20" to "0xFF" then this and all subsequent bytes in the text 
    item are coded using the default character coding table


    (..)
    Gemeint ist, dass wenn bei einem Text das erste Byte 01..1F ist (also ohnehin aus dem nicht druckbaren Bereich der Steuerzeichen),
    dann wird damit die verwendete Kodierung signalisiert. Es ist nicht die Rede davon, dass der nächste Text in den Daten die immer
    gleiche Kodierung verwendet. Ohne Angabe ist es iso6937 mit Euro.


    Für gewöhnlich wird heute lokal UTF-8 verwendet, es muss also eine korrekte Übersetzung in diese Kodierung vorgenommen werden.

  • Es gibt zwei Lösungen fur das Problem.
    1. vdr + Kodi patch epg.c --> klik
    Ubuntu 14.04

    Code
    sudo sh -c "echo \"pl_PL.ISO-8859-2 ISO-8859-2\" >> /var/lib/locales/supported.d/local"
    sudo dpkg-reconfigure locales


    /usr/local/bin/runvdr

    Code
    export VDR_LANG=pl_PL.ISO-8859-2
    export LANG=pl_PL.ISO-8859-2
    export LC_ALL=pl_PL.ISO-8859-2
    export VDR_CHARSET_OVERRIDE=ISO-8859-2


    2. vdr + softhddevice patch si.c --> klik (vdr 2.2.0)
    /usr/local/bin/runvdr

    Code
    export LANG=pl_PL.UTF-8export LC_COLLATE=pl_PL.UTF-8export VDR_CHARSET_OVERRIDE=UTF-8export LC_ALL=pl_PL.UTF-8export LANGUAGE=pl_PL.UTF-8

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!