2013-04-11 2 views
1

I'am hadoop новичок. Я пытаюсь запустить MapReduce (программирование на Java), где ключ - это несколько ключей (текст). какой тип массива я должен использовать для хранения этих ключей, чтобы передать их, а затем как параметр для outputCollector? благодаря!!!несколько ключей в MapReduce Job

+0

, если список не является сложным, то вы можете иметь ключи в одной строке, разделенные запятыми и установить, что объект Text передается в outputCollector. А в редукторе разделить ключ, чтобы получить список нескольких ключей. – Amar

ответ

0

Вы должны написать свой собственный класс, чтобы implements WritableComparable<YourClassName> хранить ключи в сжатом виде. Для хорошего примера см. this link.

+0

Да вот что я сделал =)) Спасибо! – LMHadoop

0

Если это только некоторые значения текста, я бы предложил просто отправить их как разделительную строку. это удобно и прямо. иначе вы могли бы сделать так, как предложил Кетцалькоатль. Вы могли бы найти эти 2 вопроса полезно: How do i set an Object as the Value for Map output in Hadoop MapReduce? How (in Hadoop),is the data put into map and reduce functions in correct types?

Смежные вопросы