[gelöst] Umlaute / Sonderzeichen in alten Aufnahmen nach utf-8 konvertieren?

  • Im letzten Feinschliff habe ich nun auch winscp, putty etc. auf utf-8 getrimmt, damit die Anzeige von Datei-/Verzeichnisnamen bzw. Inhalten auch bei solchen mit Umlauten/Sonderzeichen stimmt. Für neue Aufnahmen funzt das auch bestens, nur der alte Sarotti (c't-vdr...linvdr) geht nicht richtig. Bei winscp kann man sowas hier 'K�nigreich_der_Himmel' nicht mal manuell umbenennen, da 'Datei oder Verzeichnis nicht gefunden.'.
    Nun ist die Frage, wie kriege ich die alten Aufnahmen (incl. der info.vdr; möglichst automatisch) nach utf-8 getrimmt? Die google- bzw. Portalsuche fördert mir dazu nichts brauchbares zu Tage.

    yaVDR 0.6.2; H61M/U3S3 / G530 / 4GB / GT 520 (passiv) / Cine S2 (Rev. V5.5) + DuoFlex S2 / 120GB SSD (System; SATA>USB) + 3TB SATA 6Gb/s; LCD-TV Toshiba 42VL863G; AVR Yamaha RX-S600...

    Einmal editiert, zuletzt von habichthugo ()

  • Wenn du es schon gemischt hast (ISO und UTF-8 Dateinamen) ist es natürlich ungünstig...


    Aber Dateinamen korregieren geht so: convmv -f iso-8859-1 -t utf-8 -r /<vdr Aufnahmeverzeichnis>


    Für die info.vdr geht "iconv" und "find".


    So in der Art
    --
    find <videodir> -name info.vdr -print0 | xargs -0 cat <Eingabedatei> | iconv -f ISO_8859-1 -t UTF-8//TRANSLIT > <Ausgabedatei>
    --
    Musst da nur einwenig rumfummeln um die Parameter an die richtige Stelle zu bekommen. Evtl. iconv in nen Shellscript auslagern.


    Mach dir aber vorher nen Backup aller deiner info.vdr. Weil sonst wirds kompleziert wenn beim ersten Aufruf was schiefgeht.


    cu

  • Wenn du es schon gemischt hast (ISO und UTF-8 Dateinamen) ist es natürlich ungünstig...


    Ne, ist bei mir recht unkompliziert, da alle alten Aufnahmen auch noch das alte VDR-Format (nicht ts) haben. Zusammenfassung frei nach deinen Vorschlägen:

    Code
    apt-get install convmv
    for REC in $(find /srv/vdr -name 'info.vdr'); do
      REC=$(dirname $(dirname "$REC"))
      convmv --notest -f iso-8859-1 -t utf-8 "$REC" >/dev/null 2>&1 
    done
    for INFO in $(find /srv/vdr -name 'info.vdr' -o -name 'summary.vdr'); do
      if mv "$INFO" "$INFO".org; then
        iconv -f ISO_8859-1 -t UTF-8 "$INFO".org >"$INFO"
      fi
    done


    Sieht gut aus! Danke!
    Verbleiben noch ein paar Spezialsonderzeichen wie '#3A', aber die mache ich wohl fix von Hand...

    yaVDR 0.6.2; H61M/U3S3 / G530 / 4GB / GT 520 (passiv) / Cine S2 (Rev. V5.5) + DuoFlex S2 / 120GB SSD (System; SATA>USB) + 3TB SATA 6Gb/s; LCD-TV Toshiba 42VL863G; AVR Yamaha RX-S600...

  • Verbleiben noch ein paar Spezialsonderzeichen wie '#3A', aber die mache ich wohl fix von Hand...


    Die stammen von der -vfat Einstellung des VDR - wenn du da weiterhin über Samba gehen willst, würde ich die drin lassen...

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • Zitat von »habichthugo« Verbleiben noch ein paar Spezialsonderzeichen wie '#3A', aber die mache ich wohl fix von Hand...
    Die stammen von der -vfat Einstellung des VDR - wenn du da weiterhin über Samba gehen willst, würde ich die drin lassen...


    Hm, hat der normale yaVDR (0.5) das drin? Bei neueren Aufnahmen passiert diese Umkodierung bei mir nicht. Und nebenbei: Der VDR oder auch VDR-Live wandeln die Namen in der Anzeige nicht zurück, sondern lassen dort eben '#3A' stehen. Funktioniert wenn dann also nicht konsistent.
    Das ganze sieht nicht nur unschön aus, sondern verwirrt z.B. auch Scarper. Einige Codierungen scheinen für Samba bzw. Win. auch nicht nötig. Mit dem einfachen Hochkomma (#27) z.B. habe ich da (Vista) keine Probs und das kommt doch sehr häufig vor. Verbotene Zeichen sind laut Vista \/:*?"<>|. Für z.B. : würde ich dann auch eher auf ; umkodieren...

    yaVDR 0.6.2; H61M/U3S3 / G530 / 4GB / GT 520 (passiv) / Cine S2 (Rev. V5.5) + DuoFlex S2 / 120GB SSD (System; SATA>USB) + 3TB SATA 6Gb/s; LCD-TV Toshiba 42VL863G; AVR Yamaha RX-S600...

  • Hm, hat der normale yaVDR (0.5) das drin? Bei neueren Aufnahmen passiert diese Umkodierung bei mir nicht.


    Man muss es halt aktivieren, wenn man es haben will... /etc/default/vdr

    Code
    # Options that will be passed to vdr's commandline
    # for example: OPTIONS="-w 15"
    OPTIONS="-w 0 --vfat"


    Der VDR kümmert sich um die Wiederherstellung der Zeichen aus den Ersatzzeichen wenn das aktiv ist.

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)

  • Zitat von »habichthugo« Hm, hat der normale yaVDR (0.5) das drin? Bei neueren Aufnahmen passiert diese Umkodierung bei mir nicht.
    Man muss es halt aktivieren, wenn man es haben will... /etc/default/vdr
    ...
    Der VDR kümmert sich um die Wiederherstellung der Zeichen aus den Ersatzzeichen wenn das aktiv ist.


    Ok, war/ist offenbar bei mir nicht aktiv (z.B. Testaufnahme soeben '#Friedrichstadt-Palast:_Die_größte_Bühne_der_Welt_-_Countdown_zu_einer_Revue' wird dann unter Samba*Vista zu '_IE0UC~J'). Wieder so 'ne extrem lästige 'Kleinigkeit', wo keine der ootb verfügbaren Alternativen durchgängig befriedigt. Oder gibts da noch Alternativen?

    yaVDR 0.6.2; H61M/U3S3 / G530 / 4GB / GT 520 (passiv) / Cine S2 (Rev. V5.5) + DuoFlex S2 / 120GB SSD (System; SATA>USB) + 3TB SATA 6Gb/s; LCD-TV Toshiba 42VL863G; AVR Yamaha RX-S600...

  • Oder gibts da noch Alternativen?


    Was willst du da an Alternativen? Du kannst die Zeichenbeschränkungen von Samba und Windows nicht einfach ignorieren (aber Windows kann man ignorieren ;)) - nutzt man nur Unix-artige Systeme und NFS gibt es keinerlei Probleme...

    yaVDR-Dokumentation (Ceterum censeo enchiridia esse lectitanda.)


  • Was willst du da an Alternativen? Du kannst die Zeichenbeschränkungen von Samba und Windows nicht einfach ignorieren (aber Windows kann man ignorieren ;)) - nutzt man nur Unix-artige Systeme und NFS gibt es keinerlei Probleme...


    Ändere mal an der Shell die Attribute einer Datei names "-test" ;) Ich möchte nicht wissen was an Recording Hooks und vdr Addons alles aussteigt wnen nen Filmname mit "-" Anfängt.


    Linux hat die selben Probleme wie Windows, Linux ist nur besser darin solche Probleme zu ignorieren ;)



    BTW: Früher gabs mal in samba die Möglichekeit Zeichen zu remappen (":" -> ";"), ist aber leider irgendwann rausgeflogen.


    BTW2: "Hochkomma (#27)" und extremenu mögen sich auch nicht (und in den Shellscripten ist sowas auch problematisch), ist also generell ganz gut sowas zu maskieren.


    cu

  • hi,


    das mit dem remap war imho der DVLFRIENDLYFNAMES patch aber wenn man da was ändern wollte musste man den pacth mod'n, was immer auch heißt vdr neu kompilieren
    habe ich eine zeit lang benutzt, z.b. würde dort aus "ä" immer "ae", was aber unter dem gesichtspunkt der lesbarkeit schlecht war deshlab ahbe ich das immer manuell angepasst (so das umlaute und ß erhalten bleiben aber die nicht windows konformaen zeichen konvertiert wurden)
    war z.b immer im extension patch mit drin


    seit ich yavdr benutze erzeuge ich meinen vdr nur noch zu testzwecken neu, da war mir der aufwand zu groß
    aber wenn das yavdr team den pach übernehmen würde ...


    ohne den patch gibt es keine ootb lösung die gut lesbare verzeuichnisse mit samba ergibt, entweder die verkorksten namen die samba als erzatz erzeugt (wenige) oder alle verzeichnisse so richtig verkorkst mit der vfat oprion (macht echt keinen sinn alle umlaute zu verhunzen, selbst das vfat dateisystem kann die)

  • das mit dem remap war imho der DVLFRIENDLYFNAMES patch


    Ne, ich meinte schon samba selber.


    ohne den patch gibt es keine ootb lösung die gut lesbare verzeuichnisse mit samba ergibt, entweder die verkorksten namen die samba als erzatz erzeugt (wenige) oder alle verzeichnisse so richtig verkorkst mit der vfat oprion (macht echt keinen sinn alle umlaute zu verhunzen, selbst das vfat dateisystem kann die)


    Die Umlaute werden vom VDR ja auch nicht angefasst.


    cu

  • Eigentlich ist mir Samba*Win.+VDR-Video ziemlich schnurz, sprich, unter Win. mache ich mit den Aufnahmen nix. Ich tendiere also zu ungepatchten Datei- bzw. Verzeichnisnamen.

    BTW2: "Hochkomma (#27)" und extremenu mögen sich auch nicht (und in den Shellscripten ist sowas auch problematisch), ist also generell ganz gut sowas zu maskieren.


    Das verstehe ich nicht so recht. Problematisch dürften doch eigentlich nur der Slash sowie ein Bindestrich als erstes Zeichen im Datei- bzw. Verzeichnisnamen sein? Alles andere kriegt man (in Scripten) doch durch einfaches (normales) quoten in den Griff? Wo genau ist da bei extrecmenu das Problem?

    yaVDR 0.6.2; H61M/U3S3 / G530 / 4GB / GT 520 (passiv) / Cine S2 (Rev. V5.5) + DuoFlex S2 / 120GB SSD (System; SATA>USB) + 3TB SATA 6Gb/s; LCD-TV Toshiba 42VL863G; AVR Yamaha RX-S600...

  • Eigentlich ist mir Samba*Win.+VDR-Video ziemlich schnurz, sprich, unter Win. mache ich mit den Aufnahmen nix. Ich tendiere also zu ungepatchten Datei- bzw. Verzeichnisnamen.


    Das verstehe ich nicht so recht. Problematisch dürften doch eigentlich nur der Slash sowie ein Bindestrich als erstes Zeichen im Datei- bzw. Verzeichnisnamen sein? Alles andere kriegt man (in Scripten) doch durch einfaches (normales) quoten in den Griff? Wo genau ist da bei extrecmenu das Problem?


    So aus dem Gedächnis....


    HDD Archiv mit ner Aufnahme mit nem >'< ging nicht weil das für den Shellaufruf nicht maskiert wird.


    Klar ist nen Bug den man fixen kann, aber generell gibts da viele mögliche Fehlerquellen bei sowas.


    cu

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!