У нас есть автономный 2-узловой кластер Spark-1.1.0, на котором был создан Spark RDD с использованием оболочки Spark. RDD сохраняется (MEMORY_ONLY). Я не могу получить этот RDD из другой оболочки Spark, используя sc.getPersistentRDDs(). Я что-то пропустил?Persisted Spark RDD недоступен в другой оболочке Spark
1
A
ответ
2
RDD сохраняются в контексте SparkContext
, которые возникли из этого RDD и доступны только через созданный ими Spark Context.
Это означает, что вы не можете получить доступ к RDD, созданному с помощью SparkContext, из другого SparkContext B, как в случае второй Spark-оболочки.
Смежные вопросы
- 1. Как указать RDD, определенные в оболочке Spark?
- 2. spark schema rdd to RDD
- 3. Spark - Spark RDD - логическая коллекция инструкций?
- 4. Apache Spark: чтение RDD из Spark Cluster
- 5. Spark: scala - как преобразовать коллекцию из RDD в другой RDD
- 6. Array [Byte] Spark RDD для String Spark RDD
- 7. Apache Spark RDD Workflow
- 8. Spark: Манипулирование несколькими RDD
- 9. Apache Spark Rdd persist
- 10. Spark RDD data selection
- 11. Spark RDD для обновления
- 12. Spark RDD проблемы
- 13. Итерация через Spark RDD
- 14. Spark: Merge RDD
- 15. Spark RDD apend
- 16. Apache Spark RDD Split "|"
- 17. Сомнения на RDD Spark
- 18. Spark RDD Внешнее хранилище
- 19. Spark scala RDD traversing
- 20. Spark: Работает вложенная RDD
- 21. Spark RDD throwing NullPointerException
- 22. Невозможно преобразовать Spark RDD в схему RDD
- 23. Java Spark RDD в другом RDD?
- 24. Сколько RDD в кеше Spark
- 25. Несколько разделов в Spark RDD
- 26. Найти элемент в RDD Spark
- 27. Строка замените в Spark RDD
- 28. Spark - конвертировать карту в RDD
- 29. Подразделение RDD в Spark-Python
- 30. Случайный доступ в Spark RDD?
Спасибо. Но значит ли это, что нет возможности совместно использовать сгенерированное и постоянное RDD для будущего использования? Это немного похоже на принцип итеративной обработки Спарком. – smantripragada
Итерационный процесс относится к алгоритмам, которые нужно переходить через один и тот же набор данных несколько раз, делая каждый раз вычисления и потенциально преобразуя его. Если вы хотите повторно использовать результат вычисления для «будущего использования», вы всегда можете сохранить RDD на диск. Вы также можете заглянуть в [Tachyon] (http://tachyon-project.org/) для альтернативы в памяти. – maasg
Спасибо, maasg, что уточняет. Я неверно истолковал смысл упорства. – smantripragada