2014-10-14 2 views
0

У меня есть стандартные префиксы в именах файлов (QWERTY_123, POIUY_029 и т. Д.), Которые имеют одинаковые разделители все время. QWERTY ->, POIUY ->; Я разработал udf, который принимает префикс и сообщает разделителю. Теперь, как читать имена файлов в свинье, чтобы я разделил префикс на имя файла и получил разделитель для правильной загрузки файлов.Как читать имя входного файла в piglatin

ответ

0

Постановление PigStorage в вашем заявлении LOAD, как указано в пункте 2 из this post. Он поместит имя файла в первое поле в каждой записи:

A = LOAD 'input' using PigStorage(',','-tagsource'); 
B = foreach A generate $0 as input_filename; 
+0

Спасибо. Этот код просматривает все записи в файле и дает имена файлов столько раз, сколько нет. записей существует в файле [foreach A]. У меня есть два входных файла в каталоге ввода, мне просто нужны два имени файла. 'QWERTY_123.csv, POIUY_029.txt' Мне нужно только QWERTY_123 и POIUY_029 на выходе – zniv

Смежные вопросы