0
ПочемуC# UTF-8 из байтов путаницы
System.Text.Encoding.UTF8.GetString(new byte [] { (byte)0xa0 });
не приводит к
"\u00a0"
?
Я возвращаюсь обратно "\ufffd"
.
Согласно https://en.wikipedia.org/wiki/Non-breaking_space 0xa0 должно быть допустимым неразрывным пространством в UTF-8.
ах, спасибо. поэтому, если у меня есть 8-байтовый текст с байтом 0xa0, который должен быть пространством, то это, скорее всего, кодировка Latin1? – CoderBrien
Существует несколько кодировок, которые отображают U + 00A0 в 0xA0. Латинский-1 (который, в свою очередь, неоднозначен между ISO и Windows-кодировкой этого имени) является вероятной ставкой, но не уверен. –
@CoderBrien: Скорее всего. Или любые другие старомодные однобайтовые кодировки. –