0
У меня есть данные, как это:Одно значение столбца из строки в PIG
1, 0, 0
0, 1, 0
0, 0, 1
Нужна выход быть:
1, 1, 1
Как это сделать на рис?
У меня есть данные, как это:Одно значение столбца из строки в PIG
1, 0, 0
0, 1, 0
0, 0, 1
Нужна выход быть:
1, 1, 1
Как это сделать на рис?
Входной
1, 0, 0
0, 1, 0
0, 0, 1
Просто Создать новую переменную в каждой строке с одинаковым значением и применить группировку с помощью этого ключа и принять MAX для каждой переменной ..
records = LOAD '/user/cloudera/records.txt' USING PigStorage(',') AS (c1:int,c2:int,c3:int);
records_each = FOREACH records GENERATE 'KEY' as grouping_key, c1, c2, c3;
records_grp = GROUP records_each BY grouping_key;
records_grp_each = FOREACH records_grp GENERATE MAX(records_each.c1) as c1, MAX(records_each.c2) as c2, MAX(records_each.c3) as c3;
выход:
(1,1,1)
Спасибо Surender – Krish
Входные данные, как показано ниже. Ряд 1 - 1,0,0 Ряд2 - 0,1,0 Ряд3 - 0,0,1 – Krish
Google слова 'apache pig SUM'. – gobrewers14