Для причин балансировки нагрузки я хочу создать больше разделов, чем редукторы в среде Hadoop. Есть ли способ назначить разделы конкретным редукторам, и если да, где я могу их определить. Я написал отдельного Partitioner и хочу теперь обратиться к конкретному редуктору с конкретными разделами.hadoop распределяет перегородки на редуктор
Заранее благодарю за помощь!
Большое вам спасибо за ваш ответ. Правильно ли, что я не смогу проанализировать данные во время функции map и после того, как все мапперы будут выполнены, рассчитать распределение данных и затем распределить их с помощью отдельного разделителя, который просто создается после все функции карты выполняются и конкретное распределение (по данным ввода) моих данных. – beto8888
К сожалению, Hadoop не допускает такого контроля. Возможно, что-то в работе в следующем Hadoop YARN и MR2, так как это серьезный передел, но я не знаю об этом сегодня. Если я отвечу на ваш вопрос, пожалуйста, примите мой ответ. – Engineiro
user2323063, на самом деле вы можете опробовать данные, запустив карты на части данных, а затем выложите разложенные расщепления на распределенный кеш. как это можно сделать, вы можете увидеть в приложении TeraSort http://hadoop.apache.org/docs/current/api/org/apache/hadoop/examples/terasort/package-summary.html – octo