Я хочу использовать R для статистической аналитики для больших данных. Для этого я хочу использовать Spark как большой сервер данных. И использование SparkR в качестве средства связывания. Мое требование - использовать функцию агрегата и другие функции R для генерации отчета, например, подсчета каждой категории в таблице. В SparkR функция textFile возвращает RDD, и я хочу использовать ее с помощью функции R. R доступны для данных и других типов данных R. Есть ли какой-либо образец кода или руководство разработчика, пожалуйста, предложите.Использование R-функций в SparkR
2
A
ответ
1
Это совершенно новое. Только в феврале 2015 года DataBricks объявила о поддержке DataFrame в Spark. https://databricks.com/blog/2015/02/17/introducing-dataframes-in-spark-for-large-scale-data-science.html.
Ссылка, предоставленная мной, имеет образец кода для Python, но такой API существует в Python, Java, Scala и R (в разработке через SparkR) согласно объявлению.
Смежные вопросы
- 1. Использование функций применения в SparkR
- 2. Использование agg-функции в sparkR
- 3. Использование пакетов CRAN внутри SparkR
- 4. Использование substr() в столбце DataFrame в SparkR
- 5. в SparkR
- 6. как установить sparkR sql в sparkR
- 7. Точность измерения в SparkR
- 8. Поиск файла в SparkR
- 9. SparkR в Windows
- 10. потоковое в sparkR?
- 11. собирать sparkr в dataframe
- 12. Скользящее среднее в SparkR
- 13. Назначить колонку в sparkR
- 14. Алгоритм RandomForest в SparkR?
- 15. Конфигурация Hadoop в sparkR
- 16. Использование функции sum для получения значения в sparkR
- 17. unserialize error in sparkR
- 18. Статистика агрегирования в sparkR 1.4.0
- 19. округление значения в столбце - SparkR
- 20. SparkR узкое место в createDataFrame?
- 21. Невозможно запустить SparkR в Rstudio
- 22. колонка падения в функции sparkR
- 23. SparkR Написать в паркетном файл
- 24. Загрузка CSV-файлов в sparkR
- 25. Объединение двух столбцов в SparkR
- 26. Снятие ввода Дата в sparkR
- 27. write.df не работает в sparkr
- 28. dropDuplicates in SparkR
- 29. SparkR документация подробно
- 30. Использование SparkR JVM для вызова методов из файла jar Scala
Спасибо. Я нашел эту ссылку во время поиска ответа. Я не читал его полностью, этот DataFrame не является одним и тем же типом R. Позвольте мне проверить, могу ли я написать оператор, такой как таблица (dataframe $ диабет, dataframe $ status), где диабет и статус - поле в области данных – Shailesh