Я собираю некоторые файлы ЦС на ежедневной основе в структуре каталогов, которая выглядит как/tmp/data/$ yearmonth/$ day/$ hour. Таким образом, есть 24 каталогов внутри/TMP/данные/$ годМесяца/$ дняКошка, читающая из массива файлов
У меня есть сценарий оболочки, как это:
yearmonth=`date -d "-2 days" +%Y%m`
day=`date -d "-2 days" +%d`
files=()
cd /tmp/data/$yearmonth/$day
for i in `ls -a */*.tsv`
do
files+=($i)
done
Файлов массив имеют все TSV файлов, хранящиеся в нем. Я хочу «cat» всех этих tsvfiles на один tsvfiles и хочу выполнить sort | uniq -c на нем. Как это сделать? Поскольку файлы tsv становятся огромными, кот может стать очень медленным. Что может быть другой альтернативой. Благодаря
Что происходит с «кошкой»? –
Файлы ЦС действительно огромны, а работа кошки очень медленная – user1189851
Можете ли вы показать весь код? –