русский
Germany.ruForen → Архив Досок→ Webdesign und Hosting

UTF - Schrifte

78  
serb знакомое лицо21.12.05 11:02
NEW 21.12.05 11:02 
Привет всем,
вот такая проблемка.
Один сервлет работает под <Tomcat>, и проверяет <parst> <XML-String>. В заголовке <xml> стоит <encoding = "UTF-8">. Если в теле <XML> встречается умляуты, они заменяются на какие-то управляющие символы - <Steuerzeichen>. Как сделать так, чтобы <parsing> работал корректно?
#1 
scorpi_ скептик21.12.05 14:04
21.12.05 14:04 
in Antwort serb 21.12.05 11:02
Пример замены можно?
#2 
serb знакомое лицо21.12.05 14:37
NEW 21.12.05 14:37 
in Antwort scorpi_ 21.12.05 14:04, Zuletzt geändert 21.12.05 14:39 (serb)
Например, должно быть <Mäg>, а получается <MÃ╓g>. И вопрос: правильна ли такая замена? т.е получатель етого <string>а должен ее корректно снова на <Mäg> <umwandeln>?
#3 
scorpi_ скептик21.12.05 14:59
NEW 21.12.05 14:59 
in Antwort serb 21.12.05 14:37
Всё ОК. Дело в том, что в utf-8 ascii (<128) кодируются как есть, а знаки большие 127 кодируются большим количеством байтов, в том числе и Umlaut-Zeichen кодируются двумя байтами.
http://de.wikipedia.org/wiki/UTF-8
#4 
serb знакомое лицо21.12.05 15:19
NEW 21.12.05 15:19 
in Antwort scorpi_ 21.12.05 14:59
Спасибо,
значит проблема лежит на другом конце провода....
#5