2016-09-26 3 views
0

У меня есть два больших байтовых массива размером около 40000 байт. Массивы примерно на 90% аналогичны. Я хочу сжимать их как можно больше, сохраняя при этом, что они примерно на 90% похожи, сравнивая сжатые массивы. Возможно ли это?Сжатие больших байт-массивов при сохранении сходства

ответ

0

Вы можете построить для них оптимальный Хаффман, а затем использовать его для сжатия. Это не 100% гарантия того, что все аналогичные части будут одинаковыми, однако это почти на 100%, если этого достаточно.

+0

достаточно 100%. Я это проверю –