2013-03-13 3 views
0

Мне нужно написать интерфейс, который бы срубил отдельные элементы в сумке до строки. Пример: {(a), (b)} в ab.Свинья алгебраическая со строками

Во-первых, может ли алгебраический интерфейс использоваться для возврата строк или он ограничен целыми числами (длинными).

Во-вторых, есть ли место, где я могу получить доступ к некоторым примерам использования алгебраических (кроме примера COUNT, который я вижу везде).

Просто ответьте, если Algebraic можно использовать для обработки строк и сообщить мне, есть ли хорошее место, где я могу увидеть какой-то существующий код UDF (а не те, которые точно решают мою проблему).

Эти вещи я пытался:

  1. погуглить для любого UDF кода, который работает на мешках. Не получайте ничего, кроме примера COUNT, который публикуется везде
  2. Попробуйте различные варианты в Pig. По-видимому, вы не можете отменять ссылки на отдельные предметы внутри сумки, которая является обломком.
+0

@ElKamina Stackoverflow предназначен для людей, которые застряли где-то, а не в начале всей задачи. Я думаю, что все в порядке, если вы начинаете что-то, и вы просите помочь определить, какая технология лучше и почему. Но решить что-то из воздуха ... нет. – CsBalazsHungary

+0

@CsBalazsHungary Я застрял. Я искал один день в Интернете, чтобы найти какой-либо ресурс в Интернете. Кроме того, я пытаюсь использовать различные варианты скрипта свиньи, который не работает. – ElKamina

+2

@ ElKamina, тогда вы действительно должны отредактировать свой вопрос, добавив, что вы пытались и что не работает. – CsBalazsHungary

ответ

0

Наконец это то, что я понял:

  1. Если ваша проблема может быть решена с помощью JOIN так же эффективно, как GROUP, вы должны это сделать. ГРУППЫ создают сумки, с которыми сложно справиться.

  2. Вы не обязаны использовать ALGEBRAIC для работы с сумочками. Вместо этого вы можете просто написать EVAL UDF. Однако это будет намного медленнее, если размер вашей сумки большой.

+0

молодцы для сохранения :-) –

Смежные вопросы