Login
UTF - Schrifte
78
NEW 21.12.05 11:02
Привет всем,
вот такая проблемка.
Один сервлет работает под <Tomcat>, и проверяет <parst> <XML-String>. В заголовке <xml> стоит <encoding = "UTF-8">. Если в теле <XML> встречается умляуты, они заменяются на какие-то управляющие символы - <Steuerzeichen>. Как сделать так, чтобы <parsing> работал корректно?
вот такая проблемка.
Один сервлет работает под <Tomcat>, и проверяет <parst> <XML-String>. В заголовке <xml> стоит <encoding = "UTF-8">. Если в теле <XML> встречается умляуты, они заменяются на какие-то управляющие символы - <Steuerzeichen>. Как сделать так, чтобы <parsing> работал корректно?
NEW 21.12.05 14:37
in Antwort scorpi_ 21.12.05 14:04, Zuletzt geändert 21.12.05 14:39 (serb)
Например, должно быть <Mäg>, а получается <MÃ╓g>. И вопрос: правильна ли такая замена? т.е получатель етого <string>а должен ее корректно снова на <Mäg> <umwandeln>?
NEW 21.12.05 14:59
in Antwort serb 21.12.05 14:37
Всё ОК. Дело в том, что в utf-8 ascii (<128) кодируются как есть, а знаки большие 127 кодируются большим количеством байтов, в том числе и Umlaut-Zeichen кодируются двумя байтами.
http://de.wikipedia.org/wiki/UTF-8
http://de.wikipedia.org/wiki/UTF-8
NEW 21.12.05 15:19
in Antwort scorpi_ 21.12.05 14:59