Мне интересно, есть ли способ объединить текстовые файлы unix вместе быстрее чем работает cat
?Каков самый быстрый способ для нескольких файлов?
Вот проблема, с которой я столкнулся. Я строкую обработку текстового файла ~ 100G в размере . Я пытаюсь улучшить время выполнения, разбивая файл на несколько сотен меньших файлов и обрабатывая их параллельно. В конце концов я получаю файлы обратно в порядке. Время чтения/записи файла занимает несколько часов. Я хотел бы найти способ улучшить следующее:
cat file1 file2 file3 ... fileN >> newBigFile
Это требует двойной дисковое пространство как
file1
...fileN
занимает 100G и затемnewBigFile
принимает другой 100GB, а затемfile1
. ..fileN
получает удаленданные уже в
file1
...fileN
, делаяcat >>
берет на себя прочитать и время записи, когда все, что мне действительно нужно для сотни файлов в появляются как 1 файл ...
Это звучит, как вы должны использовать что-то с немного больше мышц, чем оболочки Unix. –
Я понятия не имею, о чем говорю, но можно ли манипулировать файловой записью или чем-то еще? Поскольку мне нужно было не дублировать данные, а просто объединить несколько файлов обратно в 1? – Wing