2009-10-26 2 views
1

При написании переводчиков для PDF, HTML и других документов нам нужно иметь дело с различными символами пробела и дополнительными непечатаемыми символами. ANSI четко определены, но как многие другие могут быть найдены на практике? Типичным примером является кластер в ISO10646 (я думаю):Сколько непечатаемых символов используется?

          en space 
         em space 
         thin space 
‌ ‌  ‌ ‌ zero width non-joiner 
‍ ‍  ‍ ‍ zero width joiner 
‎ ‎  ‎ ‎ left-to-right mark 
‏ ‏  ‏ ‏ right-to-left mark 

(По понятным причинам персонажи не появляются выше!).

ответ

2

Unicode будет с нами, в увеличении количества, в течение длительного времени. Если HTML или XML-документ написан в кодировке Unicode с кодировкой UTF-8, вам следует ожидать, что все и все они появятся.

В Unicode (Unicode) Базы данных символов следующий кодовые определяются как пробельные:

U+0009–U+000D (control characters, containing Tab, CR and LF) 
U+0020 SPACE 
U+0085 NEL (control character next line) 
U+00A0 NBSP (NO-BREAK SPACE) 
U+1680 OGHAM SPACE MARK 
U+180E MONGOLIAN VOWEL SEPARATOR 
U+2000–U+200A (different sorts of spaces) 
U+2028 LS (LINE SEPARATOR) 
U+2029 PS (PARAGRAPH SEPARATOR) 
U+202F NNBSP (NARROW NO-BREAK SPACE) 
U+205F MMSP (MEDIUM MATHEMATICAL SPACE) 
U+3000 IDEOGRAPHIC SPACE 
+0

@Michael спасибо - полезно. Не перекрывается с теми, которые я перечислял. –

1

В мире разработки есть по крайней мере, еще один (наиболее часто используется в веб-разработки)

  // non-breaking space 

Но чем больше вы проектировать мир тем больше вы видите различные пространства/невидимых символов. Программное обеспечение Издательского обычно имеет

  • пространства - регулярное пространство
  • ан пространства
  • ет пространство
  • тонкого пространство
  • волос пространство
  • неразрывного пробел
  • неразрывной фиксированная ширина пробел
  • шестое место
  • четверть пространства
  • третье пространство
  • пунктуация пространство
  • вровень пространство
  • фигура пространство
  • ...
+0

Да, 0xA0; см. http://en.wikipedia.org/wiki/Non-breaking_space –

+0

@Robert не могли бы вы перечислить числа? –

+0

#fail. Я только что написал те, что я вижу в своем InDesign. Я не уверен, что все они являются фактическими стандартными UNICODE. Сожалею. Некоторые из них скорее ориентированы на дизайн (например, на флеш-пространстве) и могут существовать только в программном обеспечении. –

Смежные вопросы