2015-10-07 3 views

ответ

0

Входной

1, 0, 0 
0, 1, 0 
0, 0, 1 

Просто Создать новую переменную в каждой строке с одинаковым значением и применить группировку с помощью этого ключа и принять MAX для каждой переменной ..

records = LOAD '/user/cloudera/records.txt' USING PigStorage(',') AS (c1:int,c2:int,c3:int); 

records_each = FOREACH records GENERATE 'KEY' as grouping_key, c1, c2, c3; 

records_grp = GROUP records_each BY grouping_key; 

records_grp_each = FOREACH records_grp GENERATE MAX(records_each.c1) as c1, MAX(records_each.c2) as c2, MAX(records_each.c3) as c3; 

выход:

(1,1,1) 
+0

Спасибо Surender – Krish

Смежные вопросы