Мне нужно скопировать большой кусок данных, около 300 ГБ файлов из ведро A, которое находится в нашем восточном регионе и в ведро B, которое находится в юго-восточном регионе. Также мне нужно изменить структуру ведра. Например, мне нужно перетащить файлы в разные папки на ведро B в соответствии с именем изображения, которое находится в ведре A. Я попытался использовать AWS Lambda, но он недоступен на юго-востоке.Копирование нескольких файлов в большом объеме между двумя ведрами s3, которые находятся в разных регионах
Также, сколько это будет стоить, поскольку данные будут переданы между регионами?
Мое понимание (и мои тесты) показывает, что синхронизация между ведрами * не * проходит через локальную машину. Например. Я скопировал объект размером 200 МБ между ведрами в Сиднее и Токио - это заняло 37 секунд. Когда вы просто * загружаете * объект из Сиднея (где я живу), это заняло 3 минуты. Попробуйте сами: заберите некоторые данные из этого общедоступного набора данных: 's3: // landsat-pds/L8/139/045/LC81390452014295LGN00 /' –
Спасибо за исправление Джона. Из документации 'aws s3' казалось, что команда фактически использует локальное хранилище в качестве кеша. Я удалю свой оригинальный комментарий. – kixorz
Я бы порекомендовал использовать репликацию кросс-региона, так как он связан с текущими изменениями, поэтому вам не нужно управлять сценарием с разделенным мозгом. – kixorz