У меня есть длинный список коротких строк, которые я хочу сжать, но я хочу, чтобы в любой момент можно было распаковать произвольную строку в списке без распаковки всего списка.сжать длинный список коротких строк
Я знаю список раньше времени, и это не имеет значения, насколько задействована препроцессия. Это также хорошо, если есть некоторые значительные O (1) накладные расходы памяти.
Я понимаю, что я мог бы просто сжимать каждую строку независимо с помощью алгоритма сжатия без потерь, но это не будет работать очень хорошо, потому что строки очень короткие, и каждый из них не содержит избыточности. Однако в целом список содержит много избыточности.
Как долго? Как короткие строки? Сколько они сжимают с помощью обычного компрессора? –
@MarkAdler 2 миллиона строк, средний размер 2k, я получаю ~ 35% степень сжатия с помощью gzip –