Я пытаюсь выяснить, могу ли я использовать команду gsutil на платформе Windows для загрузки файлов в Google Cloud Storage. У меня есть 6 папок на моем локальном компьютере, которые добавляют к ним новые новые документы PDF. Каждая папка содержит около 2500 файлов. Все файлы в настоящее время находятся в хранилище Google в соответствующих папках. Сейчас я загружаю все новые файлы с помощью Google Cloud Storage Manager. Есть ли способ создать пакетный файл и запланировать его автоматическое выполнение каждую ночь, чтобы он захватывал только те файлы, которые были отсканированы сегодня, и загружает их в Google Storage?Google Cloud Storage загружает файлы, измененные сегодня
Я попробовал этот формат:
python c:\gsutil\gsutil cp "E:\PIECE POs\64954.pdf" "gs://dompro/piece pos"
и загрузил файл прекрасно.
Эта команда
python c:\gsutil\gsutil cp "E:\PIECE POs\*.pdf" "gs://dompro/piece pos"
будет загружать все файлы в ведро. Но как я могу только захватить файлы, которые были изменены или сгенерированы сегодня? Есть ли способ сделать это?
Привет, большое вам спасибо за ваш ответ. Я просто попытался запустить одну папку с флагами -m и -n, и это заняло около 2 минут, так что это неплохо. 6 папок займет около 15 минут, поэтому это прямо сейчас может быть решением. Моя единственная проблема заключается в том, что иногда pdf можно редактировать (не часто, но это происходит), и оно сохраняет одно и то же имя, однако это уже не тот файл. Я могу загрузить его вручную, но если кто-то другой может предложить сценарий для загрузки любых файлов, измененных или сгенерированных на сегодняшний день, это будет самое совершенное решение. Если это невозможно, то решение, предлагаемое поводкой, будет достаточным. –
Что-то еще, что вы могли бы сделать, это проверить бит архива в файле. Если он установлен, загрузите файл. После того, как вы загрузили файл, установите бит архива в состояние «выключено». Бит архива будет автоматически установлен на OS операционной системой, если файл будет изменен. Это потребует некоторых сценариев DOS, но решит проблему необходимости повторной загрузки любых измененных файлов. – rein