Привета,Run `head` в текстовой файл внутри архива архивного без распаковки архива
Я взят из предыдущей команды и написания заданий ETL, какие файлы процесса CSV. Я использую комбинацию скриптов оболочки и perl на ubuntu. Файлы csv огромны; они прибывают как архивы с застежкой-молнией. Unzipped, многие из них более 30Gb - да, это G
Legacy process - это пакетное задание, выполняемое на cron, которое полностью распаковывает каждый файл, считывает и копирует первую строку в файл конфигурации, затем повторно застегивает весь файл. В некоторые дни это занимает много часов обработки, без каких-либо преимуществ.
Можете ли вы предложить метод для извлечения первой строки (или первых нескольких строк) из каждого файла в архиве с застежкой-молнией без полной распаковки архивов?
Я знаю, что это не ответ, но вера, по крайней мере, с помощью gzip-архивов, вы можете это сделать, даже просто vi прочитает в gzip. Для gzip это программы zcat и zgrep, я не знаю, работают ли они с обычной почтой. –
Почему задание повторно застегивает файл? Почему он не может использовать оригинальный zip-файл? –