2015-12-16 2 views
0

У меня есть сценарий оболочки unix, который будет загружать файлы с GCS на мой сервер. Я использую эту команду, и она работает очень хорошо.GSutil резюме скачать с использованием файлов трекера

python gsutil -m cp -R gs://$bucketId/*$fileListTobeDownloaded*$downloadedFileDate* $downloadFilePath 

Общий размер всех файлов, которые я загружаю, составляет 30gb. Я создаю файл трекера в определенном месте на сервере, установив state_dir в .boto файл.

Я хочу создать механизм повтора, чтобы, если некоторые из загрузок не были завершены, вместо перезапуска всего задания должны быть загружены только эти файлы, которые не выполнялись или не загружались в предыдущем запуске.

Пожалуйста, советы

+0

Вам нужно решение, которое копирует только определенные файлы из каждого ведра, или ваша цель - скопировать все файлы? –

+0

Только скопируйте определенные файлы за этот день. Чтобы привести пример, есть файлы за каждый час, поэтому нам нужно будет скопировать все 24 файла на более ранние даты – kab

ответ

0

Вы можете использовать манифесту функциональность файла сП, чтобы сделать это:

python gsutil -m cp -R -L manifest.log gs://$bucketId/*$fileListTobeDownloaded*$downloadedFileDate* $downloadFilePath 

Вам потребуется отдельный файл манифест за каждую уникальную команду сра вы выполнить. Взгляните на дополнительную документацию по опции «-L» в gsutil help cp.

Смежные вопросы