Я использую cython для синтаксического анализа больших gzipped-файлов. Есть ли какой-либо рекомендуемый способ использования библиотеки gzip в качестве файлового буфера для getline? Чтение строки из gzip в Python занимает слишком много времени.gzip в файле cython
Я хотел бы сделать это:
gzip_file = gzip.open(file_name, ¨rb¨)
getline(line,n, gzip_file)
Преобладающая мудрость (от быстрого поиска Google) показывает, что самый быстрый способ чтения GZIP файлов в Python является вызовом 'zcat' из подпроцесса (он должен быть установлен на вашей системе, хотя). Вы также можете получить значительные преимущества от упаковки 'gzip_file' в' io.BufferedReader' и с помощью 'readline'. – DavidW
спасибо, это было хорошее предложение, которое привело к моему решению. –