Привет, Я хотел бы знать, как реализовать логику поиска в Hadoop Pig. У меня есть набор записей, например, для пользователя веб-журнала, и вам нужно вернуться, чтобы получить некоторые поля из его первого посещения (а не текущего).Как реализовать логику поиска в hadoop pig
Это выполнимо на Java, но есть ли у нас способ реализовать это в Hadoop pig.
Пример:
Предположим, что для перемещения одного конкретного пользователя, идентифицированный col1
и col2
, выходной первое значение для этого пользователя в lookup_col
, в данном случае «1».
col1 col2 lookup_col
---- ---- -----
326 8979 1
326 8979 4
326 8979 3
326 8979 0
Это, вероятно, возможно для чистой свиньи, но вам нужно будет дать некоторый образец ввода. – mr2ert