Я ищу способы отправить работы для нескольких компьютеров на моей компьютерной сетке университета.Должен ли я отдать предпочтение hadoop против кондора при работе с R?
В настоящее время он эксплуатирует Condor, а также предлагает Hadoop.
Мой вопрос заключается в том, следует ли мне попробовать взаимодействовать с R в Hadoop или с Conder для моих проектов?
Для обсуждения предположим, что мы говорим о смущающих параллельных задачах.
p.s: Я видел ресурсы, описанные в CRAN task views.
Я сомневаюсь, что Hadoop работает сверху на Condor, у Hadoop есть собственная файловая система (HDFS) и Map/Reduce framework. – khmarbaise
Спасибо khmarbaise - Я не знаю о подстилающей системе, ваш комментарий полезен для понимания. –
Hadoop действительно работает на вершине Кондора. Вы можете использовать Condor для сопоставления рабочих Hadoop с машинами, которые затем запускают и обрабатывают ваши рабочие нагрузки Hadoop. Система планирования Condor намного мощнее, чем все, что предлагает Hadoop изначально. См. Http://hadoopblog.blogspot.com/2009/07/hadoop-and-condor.html –