У меня есть сценарий свиньи для загрузки, обработки и хранения данных.две функции магазина в одном сценарии свиньи
Если в одном скрипте с одной свиньей есть две функции магазина, как это работает?
a = load 'somefile' using PigStorage(',');
b ...
c ...
d ...
e = store d into 'output1';
f = store c into 'output2';
Выполняется ли это два раза для каждого магазина. То есть для магазина «е» это процесс от «а» до «е» и магазина «F» она непосредственно хранить «C», так как он уже обработан или снова начать с «а»?
Спасибо, это помогло мне понять концепцию. И еще одно сомнение, которое я получил здесь: если он принимает больше одного задания, он загружается два раза для каждого магазина, я имею в виду, что он загружает «somefile» два раза для каждого магазина «e» и «f» – Shri
Это действительно зависит от того, что вы делаете. Обычно Свинга достаточно умна, чтобы не нагружать что-то дважды, если это возможно. Как я уже сказал, вы должны взглянуть на план, прежде чем позволить ему работать, если это важно для вас. –
Спасибо, что это мне помогло. Можете ли вы предложить мне это http://stackoverflow.com/questions/21698582/cassandra-hadoop-pig-design-for-loading-and-processing-data ,,, извините, если я не должен спрашивать об этом здесь, но мне нужна помощь. – Shri