2012-06-01 5 views

ответ

1

RevolutionAnalytics/RHadoop реализация пакетов RHadoop проекта соединяет Hadoop и R с помощью rhdfs, rhbase и РМР.

Я знаю, что реализация алгоритма кластеризации K-средних является «стандартным» способом (используя Python, Pig и Java, как показано на слайдах 8-10) по сравнению с использованием только R (с пакетом rmr, показанным на слайдах 14- 15): он занимает гораздо меньше кода, и может быть реализован на одном языке

в той же документации есть comparison implementation of K-means in Python, Java and R, который показывает, как легко использует R.

Если вы запустите этот пакет на Hadoop кластер, вы можете написать кластер K-mean на Hadoop.

IF R не является вашим выбором, тогда кластеризация K-типа (построение с использованием MapReduce) доступна на Hadoop и Mahout, поэтому вы можете сделать это на кластерах Hadoop.

Смежные вопросы