Существуют ли существующие кластеры кластера R (kmeans, иерархические), которые используют RHadoop или RHIPE для работы на распределенных кластерах?R Распределенный пакет кластеризации
Благодаря
Существуют ли существующие кластеры кластера R (kmeans, иерархические), которые используют RHadoop или RHIPE для работы на распределенных кластерах?R Распределенный пакет кластеризации
Благодаря
RevolutionAnalytics/RHadoop реализация пакетов RHadoop проекта соединяет Hadoop и R с помощью rhdfs, rhbase и РМР.
Я знаю, что реализация алгоритма кластеризации K-средних является «стандартным» способом (используя Python, Pig и Java, как показано на слайдах 8-10) по сравнению с использованием только R (с пакетом rmr, показанным на слайдах 14- 15): он занимает гораздо меньше кода, и может быть реализован на одном языке
в той же документации есть comparison implementation of K-means in Python, Java and R, который показывает, как легко использует R.
Если вы запустите этот пакет на Hadoop кластер, вы можете написать кластер K-mean на Hadoop.
IF R не является вашим выбором, тогда кластеризация K-типа (построение с использованием MapReduce) доступна на Hadoop и Mahout, поэтому вы можете сделать это на кластерах Hadoop.