Я шел по кругу по этой проблеме, где JSON UTF-8 строка, возвращаемая из сервера содержит Юникод пару, как это:Какова форма представления unicode?
\ u00c3 \ u00bc
который визуализируется как два отдельных символа. Однако он должен отображаться как один символ. Согласно таблице я нашел at this link, вот еще несколько примеров:
0xc3,0xa0 agrave
0xc3,0xa1 aacute
0xc3,0xa2 acircumflex
0xc3,0xa3 atilde
0xc3,0xa4 adiaeresis
0xc3,0xa5 aring
0xc3,0xa6 ae
0xc3,0xa7 ccedilla
0xc3,0xa8 egrave
0xc3,0xa9 eacute
0xc3,0xaa ecircumflex
0xc3,0xab ediaeresis
0xc3,0xac igrave
0xc3,0xad iacute
0xc3,0xae icircumflex
0xc3,0xaf idiaeresis
0xc3,0xb0 eth
0xc3,0xb1 ntilde
0xc3,0xb2 ograve
0xc3,0xb3 oacute
(Каждый случай, когда я вижу это в моих данных будет преобразовать в соответствующего одного символа.)
Многие из них, по-видимому являются «алиасами» синглетных форм, таких как «\ uxxxx», но я получаю их так, как дублеты. Байт необработанных данных показывает, что это фактически то, как оно передается с сервера.
(После того, как я получил их в UTF-8, нет никакой причины для меня, чтобы держать их таким образом в местном представительстве в памяти.)
Я не знаю, как назвать это, так что я m с трудом находят много информации об этом, и я не могу четко рассказать об этом. Я хотел бы знать, почему он используется и где я могу найти код, который преобразует его в то, что мой UIWebView может отображать правильно, но зная, что он называется, является точкой моего вопроса.
Мой вопрос - это то, что называется дублетом или парной формой?
(если это полезно, я работаю в Objective-C и CocoaTouch.)
Благодарим за указание кодировки UTF-8 в вашем третьем абзаце. Я должен был это узнать сам. Это очень поучительно. – Jim