Предположим, у нас есть 100 гб файла. И моя система 60gb. Как apache spark будет обрабатывать эти данные? Мы все знаем, что искра выполняет разделы самостоятельно на основе кластера. Но тогда, когда есть уменьшенный объем памяти, я хочу знать, как искра обрабатывает его.Apache spark- bigdata
2
A
ответ
5
Вкратце: Spark не требует полного набора данных, чтобы он сразу помещался в память. Тем не менее, некоторые операции могут потребовать, чтобы весь раздел набора данных поместился в память. Обратите внимание, что Spark позволяет вам контролировать количество разделов (и, следовательно, их размер).
См. this для получения более подробной информации.
Стоит также отметить, что объекты Java обычно занимают больше места, чем исходные данные, поэтому вы можете посмотреть this.
Также я бы рекомендовал смотреть на Apache Spark : Memory management and Graceful degradation
Смежные вопросы
- 1. Apache Hadoop против Google Bigdata
- 2. Анализ Bigdata в nosql
- 3. Apache Spark vs Apache Ignite
- 4. apache spark implementation
- 5. Обработка исключений Apache Spark
- 6. Apache Spark: SparkPi Пример
- 7. apache spark bluemix невозможно
- 8. Apache Drill vs Spark
- 9. Hadoop, Apache Spark
- 10. Авторизация в Apache Spark
- 11. Apache Spark в
- 12. Документация Apache Spark SQL
- 13. Java - Apache Spark связи
- 14. Apache Spark GraphX java.lang.ArrayIndexOutOfBoundsException
- 15. Apache Spark SQL NumberFormatException
- 16. Apache spark - java.lang.NoClassDefFoundError
- 17. Ошибка сбоя Apache Spark
- 18. Talend и Apache Spark?
- 19. Apache Spark - серверы backend
- 20. Mergesort using apache-spark
- 21. Обновить стратегию Apache Spark
- 22. Apache Spark и node.js
- 23. Apache Spark Создатель DAG
- 24. Apache Spark mapPartitionsWithIndex
- 25. Apache Spark: ступенчатое исполнение
- 26. Apache Cassandra and Spark
- 27. apache Spark с улей
- 28. Apache Spark - Управление памятью
- 29. Apache Spark Рекомендация ALS
- 30. Apache Spark S3 Ошибка
60GB оперативной памяти? Как правило, Spark даже не сохраняет наборы данных на диске, если вы его не попросите. –
Вы имеете в виду постоянные данные в памяти? :) – Bacon