2015-08-25 5 views
0

Приносим извинения за отсутствие кода, поскольку это функциональный вопрос.Выполнение R-моделей в Spark

Я посмотрел на SparkR. Он позволяет манипулировать данными, хранящимися в Spark, через R-код. Однако он не имеет доступа к SPark-Mllib до выпуска Spark 1.5, который является WIP.

Однако на данный момент - Можем ли мы выполнить модели R на данных, хранящихся в Spark, через SparkR?

Спасибо, Manish

+0

Нет, к сожалению, вы не можете. Однако вы можете преобразовать свои данные в SparkR, собрать его в R, построить и предсказать в R и переработать в SparkR DataFrame, если хотите, и если ваш набор данных не слишком большой. –

ответ

0

Если установить версию развития от искровой Apache repository, есть некоторые модели доступны для игры. В частности, если вы посмотрите на mllib.R, то доступен метод glm (с связанными predict и summary способами).