После некоторых нарезки и нарезки я получаю относительно небольшой набор данных, который я хочу обрабатывать в автономном режиме. Я в конечном итоге это пишу:Как автоматизировать экспорт данных в свинье?
store foo into 'foo' using PigStorage('\t');
copyToLocal foo foo;
rm foo;
sh cat foo/part* | sort -k... -o foo.tsv;
sh rm -rf foo;
Я хотел бы заменить эти 5 строк с макровызовым, но это не взгляда, как я могу - я получаю Unexpected character '|'
, когда я делаю.
Итак, можно ли повторять эти 5 строк несколько раз в каждом скрипте?
Кстати, вам не нужно указывать «использование PigStorage ('\ t')». Он используется по умолчанию – Ruslan