2016-08-30 2 views
1

Я реализовал алгоритм randomforest в R и попытался реализовать то же самое с помощью sparkR (от Apache Spark 2.0.0).Алгоритм RandomForest в SparkR?

Но я нашел только линейные модели функции, такие как GLM() реализацию в sparkR https://www.codementor.io/spark/tutorial/linear-models-apache-spark-1-5-uses-present-limitations

и не могли в состоянии найти RandomForest (алгоритм дерева принятия решений) примеры. Существует RandomForest в MLLib Spark, но также не может найти привязки R для MLLib.

Пожалуйста, дайте мне знать, поддерживает ли SparkR (2.0.0) RandomForest? иначе можно ли подключить SparkR к MLlib для использования RandomForest? Если нет, то как мы можем добиться этого, используя SparkR?

ответ

1

Правда, в настоящее время он недоступен в SparkR. Возможная опция - создать случайный лес на распределенных кусках данных и объединить ваши деревья позже. В любом случае все о случайности.

Хорошая ссылка: https://groups.google.com/forum/#!topic/sparkr-dev/3N6LK7k4NB0

+0

С тех пор она стала доступна: https://spark.apache.org/docs/2.1.0/api/R/spark.randomForest.html –

Смежные вопросы