Лучше сказать Кодировка символов вместо Codepage
Персонаж Кодирование представляет собой способ отображения какой-то характер некоторых данных (а также наоборот!)
Как говорит Википедия :
Система кодирования символов состоит из кода, который соединяет каждый символ из данного репертуара с чем-то другим, например последовательность натуральных чисел, октетов или электрических импульсов, чтобы облегчить itate передачи данных (как правило, цифры и/или текст) через телекоммуникационные сети или хранение текста в компьютерах
Самые популярные кодировки символов являются ASCII, UTF-16 и UTF-8
ASCII
Первая кодовая страница, которая широко используется в компьютерах. в ANSI для каждого символа выделяется только один байт. Поэтому ANSI может иметь очень ограниченный набор символов (английские буквы, цифры, ...)
Как я уже говорил, ASCII использовался в старых операционных системах, таких как MS-DOS. Но ASCII не мертв и все еще используется. Когда у вас есть txt-файл с 10 символами и 10 байтов, у вас есть файл ASCII!
UTF-16
В UTF-16, два байта выделяется из символа. Таким образом, мы можем иметь 65536 различных символов в UTF-16!
Microsoft Windows использует UTF-16 внутренне.
UTF-8
UTF-8 является еще одним популярным способом для кодирования символов. он использует байты переменной длины (от 1 до 4 байтов) для символов. Он также совместим с ASCII, потому что использует 1 байт для символов ASCII.
системы на основе Unix Большинство использует UTF-8
Языки программирования не зависят от кодовых страниц. Возможно, конкретная реализация языка программирования не поддерживает кодовые страницы (например, Turbo C++)
Вы можете использовать любую кодовую страницу на современных языках программирования. У них также есть инструменты для преобразования кодовых страниц.
Существует разные версии Unicode, как UTF-7, UTF-8, ... Вы можете прочитать о них here (рекомендовано как!) И, возможно, для более формальных деталей here
Почему «опишите это своими словами, а не ссылкой»? Особенно, если цитата хорошая. –