2015-04-02 7 views
2

Мне нужно загрузить ~ 2 миллиона CSV-файлов из ведра S3 в таблицу Redshift. Это было бы просто (просто используйте COPY с подстановочным знаком или файлом манифеста), за исключением того, что мне нужно включить имя каждого файла в результирующую таблицу. Пусть file1.csv и file2.csv оба содержат:Включить имя файла в Redshift COPY

a,b,c 
d,e,f 

Я хочу, чтобы мой стол, чтобы

file1 a b c 
file1 d e f 
file2 a b c 
file2 d e f 

Есть ли способ, это может быть достигнуто с помощью одного COPY заявления? Или мне нужно будет перебирать список файлов и загружать/вставлять их по одному?

Я подозреваю, что последний вариант будет хитом производительность ...

ответ

4

Это не возможно в настоящее время.

Вот краткое нить на форуме AWS, с ответом от AWS, что есть «создана функция запроса», но «не может обеспечить ETA на этом»: https://forums.aws.amazon.com/thread.jspa?messageID=590722&#590722

Аналогичный вопрос уже на стеке Обмен валюты: Redshift add column when importing with COPY

Смежные вопросы