Im пытается подсчитать количество дубликатов членов и иметь число> 1 в файле со списком идентификаторов. Я побежал ниже, но получил 1 значение, которое я думаю, это просто подсчет количества строк в MemberID колонки:Как подсчитать повторяющиеся значения в PIG
ids = load 'ids';
ids = filter ids by id;
group = group ids ALL;
count = foreach group generate count (ids);
dump count;
На самом деле мой файл имеет 2 столбца, столбец идентификаторов и столбцы createate. Как мне подсчитать количество идентификаторов> 1 с датой создания 30 дней с сегодняшнего дня? – Tai