Мне интересно, как это было реализовано в прошлом, и я хочу получить информацию о том, как я могу реализовать собственный набор символов.Как создать набор символов, например ASCII?
ответ
ASCII (американский стандартный код для обмена информацией) был «оригинальным» набором символов и остается основой большинства текстовых данных. ASCII фактически является 7-битным кодом (числовые значения варьируются от 0 до 127) с самым значительным битом байта, указывающим, относится ли остальная часть байта к ASCII (если равна нулю) или к текущей кодовой странице.
В эти кодовые страницы были добавлены дополнительные символы (не ascii), и компьютер пользователя загрузил определенную кодовую страницу для использования. К сожалению, это означало, что вам нужно было загрузить правильную кодовую страницу перед просмотром файла или появятся неправильные символы.
Мы переместились дальше, и в большинстве систем используется Unicode, который представляет собой переменную длину символа (а не однобайтные символы, используемые ранее), которые могут содержать тысячи и тысячи символов, что позволяет использовать одну кодировку для чего было бы несколько кодовых страниц с использованием старого кода ASCII + Codepage.
Это краткая история; Что касается того, как создать свой собственный набор символов, я не уверен, чего вы пытаетесь достичь - вы можете создавать свои собственные шрифты, но если вы говорите о фактическом наборе символов (т.е. символы, которые еще не существуют) вам нужно будет добавить свой набор символов в стандарт, такой как Unicode, чтобы другие компьютеры могли использовать ваши новые персонажи, что было бы значительным объемом работы (и я понятия не имею, как вы это сделаете) Однако стоит подумать, что почти каждый существующий персонаж уже существует в Юникоде, поэтому вы можете просмотреть, что уже было сделано, прежде чем пытаться предпринять мамонт, например, создать совершенно новый набор символов.
«Оригинал ...» * \ * cough \ * cough \ ** https://en.wikipedia.org/wiki/EBCDIC – deceze
Хороший вопрос, хорошо сделанный - я старался держать его как можно короче, а не зайдите во всю историю наборов символов (отсюда «Оригинал», а не оригинал)! – SteJ
Не все страницы кода являются надмножествами ASCII. Очень популярный в PC-эпохе CP437 (IBM OEM) набор символов имеет графические символы вместо большинства управляющих символов. ☺☻ ♥ ♦ ... ▲ ▼ –
- 1. Преобразовать набор символов ASCII обратно в строку
- 2. Encode URL с US-ASCII набор символов
- 3. Набор символов Oracle ASCII - .Net-расширения
- 4. Что означает предполагаемый набор символов ASCII?
- 5. Получить набор символов US ASCII - Python
- 6. NSXMLParser, выпуск с ASCII Набор символов
- 7. Набор символов ASCII проблема в Java
- 8. Как я конвертировать набор символов ASCII в строку
- 9. Как представить набор символов не-ascii в регулярном выражении Python?
- 10. Как создать набор символов в Scala?
- 11. Как проверить, содержит ли файл определенный набор символов (например:^& ^)
- 12. Печать ASCII-символов
- 13. Соответствует, если строка содержит только набор символов ASCII
- 14. Как программно идентифицировать набор символов файла?
- 15. Как заменить не-ASCII символов
- 16. число символов ascii> число символов не-ascii в sql
- 17. Печать символов Ascii
- 18. Кодирование строку символов ASCII
- 19. Расширенное преобразование символов ASCII
- 20. Как создать кодировку символов с нуля
- 21. Нормализация символов ASCII
- 22. отображение ASCII символов
- 23. JMeter: сравнение ASCII символов
- 24. URL-кодирование символов ASCII/UTF16
- 25. Geopy давится ASCII символов
- 26. представление расширенных символов ascii
- 27. диапазон поиска символов ascii
- 28. Поиск символов non-ascii
- 29. PHP набор символов проблемы
- 30. Получить ASCII-значение расширенных символов ASCII в php
1. Сделайте произвольную таблицу подходящим для отображения байтов символам. 2. Внесите необходимое программное обеспечение, чтобы научить все релевантное программное обеспечение выбранному вами отображению и отобразить символы на экране. (Необязательно: 3. Получите его одобренным органом по стандартизации и/или включенным в другое программное обеспечение, так что оно широко поддерживается.) – deceze
Первый шаг - если вы собираетесь документировать его в электронном виде - выберите набор символов, который будет использоваться для файла документации , ☺ –