Сжатие больших байт-массивов при сохранении сходства

У меня есть два больших байтовых массива размером около 40000 байт. Массивы примерно на 90% аналогичны. Я хочу сжимать их как можно больше, сохраняя при этом, что они примерно на 90% похожи, сравнивая сжатые массивы. Возможно ли это?Сжатие больших байт-массивов при сохранении сходства

источник

2016-09-26 FS' Wæhre

Вы можете построить для них оптимальный Хаффман, а затем использовать его для сжатия. Это не 100% гарантия того, что все аналогичные части будут одинаковыми, однако это почти на 100%, если этого достаточно.

источник

2016-09-26 15:24:44

достаточно 100%. Я это проверю –

Сжатие больших байт-массивов при сохранении сходства

ответ

Смежные вопросы