Nationale Inhalte

Liebe/-r Experte/-in,

unter mysql stehen Dinge wie Zubehör, also falschem Umlaut. Welche Kollation ist für deutschen Text die richtige?

Liebe/-r Experte/-in,

unter mysql stehen Dinge wie Zubehör, also falschem Umlaut.
Welche Kollation ist für deutschen Text die richtige?

Generell ist die sinnvollste Kollation für eine Datenbank ist UTF-8, da nahezu jeder Zeichensatz damit gespeichert werden kann.

ISO 8859-1 dient der Kodierung von deutschen Zeichen, ist jedoch definitiv nicht (mehr) empfehlenswert sobald es um mehrsprachige Projekte geht.

generell kannst du für deutsche texte

utf8_general_ci

wenn diese zeichen kommen muss du darauf achten das du den string auch im richtigen zeichensatz in mysql einträgst.

also…
die zeichensätze in mysql sind deshalb ein so ätzendes thema, weil das problem meist in der schnittstelle, und nicht in der datebank begründet liegt…
ich brauche daher mehr infos:
wie kommen die daten in die datdenbank und wie werden sie ausgelesen?

allgemeines zum thema:
http://dev.mysql.com/doc/refman/5.0/en/charset.html
schau insbesondere mal unter cast und convert nach

wie kommen die daten in die datdenbank und wie werden sie
ausgelesen?

  1. txt.gz-Daten von commission junction werden entpackt per gunzip
  2. Diese CSV-Dateien werden per

while (($data = fgetcsv($handle, 4096, ‚,‘)) !== FALSE)

aufgeteilt und per $data[„XY“]-Bausteinen mittels mysql_query($zeichenkette) eingefügt.

sehe ich das richtig? es handelt sich hier um php? es ist sehr schwierig zu antworten wenn ich immer eine glaskugel verwenden muss um mir zusammenzureimen was passiert.
ich kann zuverlässig sagen das es sich nicht um ein MySQL problem handelt. php verwendet ISO-8859-1 und es ist mir selbst nie gelungen zeichensätze wie UTF8 _zuverlässig_ mit php umzuwandeln.

sehe ich das richtig? es handelt sich hier um php? es ist sehr schwierig zu antworten wenn ich immer eine glaskugel verwenden muss um mir zusammenzureimen was passiert.
ich kann zuverlässig sagen das es sich nicht um ein MySQL problem handelt. php verwendet ISO-8859-1 und es ist mir selbst nie gelungen zeichensätze wie UTF8 _zuverlässig_ mit php umzuwandeln…