Мне нужно загрузить ~ 2 миллиона CSV-файлов из ведра S3 в таблицу Redshift. Это было бы просто (просто используйте COPY
с подстановочным знаком или файлом манифеста), за исключением того, что мне нужно включить имя каждого файла в результирующую таблицу. Пусть file1.csv
и file2.csv
оба содержат:Включить имя файла в Redshift COPY
a,b,c
d,e,f
Я хочу, чтобы мой стол, чтобы
file1 a b c
file1 d e f
file2 a b c
file2 d e f
Есть ли способ, это может быть достигнуто с помощью одного COPY
заявления? Или мне нужно будет перебирать список файлов и загружать/вставлять их по одному?
Я подозреваю, что последний вариант будет хитом производительность ...