Обычный метод URL-кодирования символов в Юникоде состоит в том, чтобы разбить его на 2% HH-коды. (\ u4161 =>% 41% 61)Unicode URL-декодирование
Но, как это юникода отличается при декодировании? Откуда вы знаете, что % 41% 61 является \ u4161 - \ x41 \ x61 ("Aa")?
Есть 8-битные символы, которым требуется кодирование, которым предшествует % 00?
Или, что предполагается, что символы Unicode будут потеряны/разделены?
Это именно то, что следует использовать. Описанные вами персонажи могут показаться странными, но ни один из них не будет управляющим персонажем (так работает UTF-8), и это действительно хорошо. – 2010-10-08 07:55:33