Я очень новичок в hadoop.Как сделать 3-этапную карту Уменьшить поток?
В настоящее время у меня есть картер, редуктор и сумматор. И я мог бы сделать cat file | mapper.py | reducer.py | combiner.py
, чтобы получить результат. И этап восстановления смущает парализуемость. Итак, может ли кто-нибудь сказать мне, как сделать это в потоке хаопа, учитывая, что у меня есть кластер хаопов?
'' reducer' и combiner' код такой же, если операция является коммутативной и ассоциативной в редукторе. вы можете сослаться на [this] (http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/) –