Для проекта сжатия данных я хочу иметь возможность редактировать и читать двоичные файлы. Для этого конкретного проекта очень важно получить 256 комбинаций из 1 байта, я заметил, что сохранение одного символа в блокноте приводило к 1-байтовому файлу , это замечательно, если имеется 256 символов, связанных со всеми 8-битными комбинациями. ASCII в настоящее время предлагает около 218 печатных символов, остальные - контрольные символыРедактировать и читать двоичные файлы?
Я знаю, что имеется 256 комбинаций из 8 бит (1 байт) из-за 2^8 = 256, и я хочу иметь возможность использовать все эти комбинации для Сжатие данных. Таким образом, двоичный редактор и читатель были бы идеальны!
Непонятно. Какое представление символа связано с двоичными значениями? –
@ PM77-1 Я редактировал вопрос более конкретно – ErikBrandsma
Ваш вопрос действительно, но у вас есть некорректная информация. ASCII - это набор символов из 128 символов с одним кодированием, который испускает значения байтов от 0 до 127. Текстовые файлы обычно не были ASCII за несколько десятилетий. Ваш номер 218 должен основываться на каком-то другом наборе символов, может быть, на ISO 8859-1. Но это не относится к текстовым файлам, в общем, к примерам файлов с относительно низким отношением информации к хранению. Вы можете обнаружить, что алгоритм, основанный на фактических байтовых значениях, используемых в файле (или блоке), даст лучшее сжатие, чем тот, который рассматривает только фиксированный, больший набор. –