2017-02-11 3 views
-1

Для проекта сжатия данных я хочу иметь возможность редактировать и читать двоичные файлы. Для этого конкретного проекта очень важно получить 256 комбинаций из 1 байта, я заметил, что сохранение одного символа в блокноте приводило к 1-байтовому файлу , это замечательно, если имеется 256 символов, связанных со всеми 8-битными комбинациями. ASCII в настоящее время предлагает около 218 печатных символов, остальные - контрольные символыРедактировать и читать двоичные файлы?

Я знаю, что имеется 256 комбинаций из 8 бит (1 байт) из-за 2^8 = 256, и я хочу иметь возможность использовать все эти комбинации для Сжатие данных. Таким образом, двоичный редактор и читатель были бы идеальны!

+0

Непонятно. Какое представление символа связано с двоичными значениями? –

+0

@ PM77-1 Я редактировал вопрос более конкретно – ErikBrandsma

+0

Ваш вопрос действительно, но у вас есть некорректная информация. ASCII - это набор символов из 128 символов с одним кодированием, который испускает значения байтов от 0 до 127. Текстовые файлы обычно не были ASCII за несколько десятилетий. Ваш номер 218 должен основываться на каком-то другом наборе символов, может быть, на ISO 8859-1. Но это не относится к текстовым файлам, в общем, к примерам файлов с относительно низким отношением информации к хранению. Вы можете обнаружить, что алгоритм, основанный на фактических байтовых значениях, используемых в файле (или блоке), даст лучшее сжатие, чем тот, который рассматривает только фиксированный, больший набор. –

ответ

0

Боюсь, что вы вопрос не достаточно конкретный. Какую технику вы ищете? Hex не является поддельным двоичным, это просто другое представление тех же данных.

Если вы находитесь в окнах, откройте калькулятор и переключите его в «режим программирования». Это позволит вам конвертировать значения из десятичного, шестнадцатеричного и двоичного представления. Затем найдите себе шестнадцатеричный редактор, и вы в бизнесе.

Поскольку вы упоминаете «ASCII», я предлагаю вам прочитать сообщение Джоэла Спольскиса о кодировке символов. Это отличный пост, в котором разъясняется, насколько сложно показать простой текст. Сообщение с 2003 года, но все еще актуально. https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no-excuses/

Смежные вопросы