hallo,
habe ein problem mit wget, hole per wget relevante daten aus einer website, die dann in einem txtfile gespeichert werden. Das funktioniert auch wunderbar. Allerdings nicht wenn die webseite im header kein charset angegeben hat. Dann werden die daten zwar auch geholt und im textfile gespeichert, allerdings als "data" anstatt utf8, iso oder sonst ein charset.
darauf gestoßen bin ich als ich "file txtfile" in der console eingegeben hab, wenn in der htmlseite ein charset angegeben ist, hat auch das txtfile dieses charset, ansonsten halt data
wenn ich nun versuche das txtfile in ein char array einzulesen dann bricht das programm mit "speicherzugriffsfehler" bei sonderzeichen ab.
gibt es eine möglichkeit wget zu sagen das es immer die daten in utf8 speichern soll ?
oder das textfile, was fälschlicherweise als "data" gespeichert wurde in utf8 zu konvertieren ?
oder beim einlesen des txtfiles in ein char array die sonderzeichen einfach ignoriert ?
hab schon stundenlang google durchsucht, und das wget manual durchgearbeitet, konnte aber keine lösung finden.
Hat da jemand nen tip ?