Hallo Leute
Ich habe in einem Java-Programm Text, der Zeichen enthält, die nicht im ISO-8859-1-Zeichensatz enthalten sind. Diesen Text möchte ich nun ISO-8859-1-codiert in eine Textdatei schreiben. Dabei sollen aber diese Sonderzeichen durch ein möglichst ähnliches Zeichen ersetzt werden, um die Lesbarkeit des Textes halbwegs zu erhalten.
In etwa also die Funktionalität, wie sie z.b. das notepad.exe unter Windows XP liefert: Habe ich eine UTF-8 Datei die u.a. ein c mit Hatschek beinhaltet und ich speichere diese Datei mit Speichern-Unter als ANSI (also ISO-8859-1) ab, wird das Hatschek-c durch ein normales c ersetzt.
Im Java habe ich bisher nur was gefunden, dass diese Sonderzeichen durch ein Fragezeichen ersetzt oder komplett weglässt.
Jetzt kann ich natürlich selber eine Ersetzungstabelle basteln und allen Zeichen ein halbwegs ähnliches aus dem ISO-8859-1 zuordnen. Aber das ist mühsam. Natürlich gibt es auch Zeichen ohne einer sinnvollen Entsprechung - im Prinzip alles, was nicht auf lateinischen Buchstaben basiert. Aber die kommen in meinen Texten praktisch nie vor.
Gibt es da fix-fertigen Standardcode den ich weiterverwenden kann?
Google-Suche liefert leider nichts brauchbares…
lg
Erwin