Копирование нескольких файлов в большом объеме между двумя ведрами s3, которые находятся в разных регионах

Мне нужно скопировать большой кусок данных, около 300 ГБ файлов из ведро A, которое находится в нашем восточном регионе и в ведро B, которое находится в юго-восточном регионе. Также мне нужно изменить структуру ведра. Например, мне нужно перетащить файлы в разные папки на ведро B в соответствии с именем изображения, которое находится в ведре A. Я попытался использовать AWS Lambda, но он недоступен на юго-востоке.Копирование нескольких файлов в большом объеме между двумя ведрами s3, которые находятся в разных регионах

Также, сколько это будет стоить, поскольку данные будут переданы между регионами?

источник

2015-09-14 Jeevan Dongre

Используйте репликацию bucket, а затем создайте еще одно ведро в своей целевой области и выполните манипуляции с объектным ключом S3.

Подробнее о S3 cross-region replication.

источник

2015-09-14 23:26:45 kixorz

Метод

AWS Command-Line Interface (CLI)aws s3 cp имеет команду, которая может быть использована для перемещения объектов между ковшами (даже в разных регионах), и может переименовать их в то же самое время.

aws s3 cp s3://bucket-in-us/foo/bar.txt s3://bucket-in-ap/foo1/foo2/bar3.txt

Существует также aws s3 sync вариант, который может быть использован для синхронизации контента между двумя ведрами, но это не поможет вашему требованию переименовывать объекты.

Стоимость

передачи данных сборов из регионов США в другой регион показаны на Amazon S3 pricing page в США $ 0.02/GB.

источник

2015-09-14 23:53:20

Мое понимание (и мои тесты) показывает, что синхронизация между ведрами * не * проходит через локальную машину. Например. Я скопировал объект размером 200 МБ между ведрами в Сиднее и Токио - это заняло 37 секунд. Когда вы просто * загружаете * объект из Сиднея (где я живу), это заняло 3 минуты. Попробуйте сами: заберите некоторые данные из этого общедоступного набора данных: 's3: // landsat-pds/L8/139/045/LC81390452014295LGN00 /' –

Спасибо за исправление Джона. Из документации 'aws s3' казалось, что команда фактически использует локальное хранилище в качестве кеша. Я удалю свой оригинальный комментарий. – kixorz

Я бы порекомендовал использовать репликацию кросс-региона, так как он связан с текущими изменениями, поэтому вам не нужно управлять сценарием с разделенным мозгом. – kixorz

Копирование нескольких файлов в большом объеме между двумя ведрами s3, которые находятся в разных регионах

ответ

Смежные вопросы