Так что я использую функцию groupByKey в искры, но ее не распараллеливают, так как я вижу, что во время ее выполнения используется только 1 ядро. Кажется, что данные, с которыми я работаю, не позволяют распараллеливать. Есть ли способ искры знать, являются ли входные данные дружественными к параллелизации или если это не правильный RDD?Есть ли способ проверить, является ли переменная в Spark параллелизуемой?
1
A
ответ
1
Блок распараллеливания в Spark является «разделом». То есть, RDD разделяются на разделы, и преобразования применяются к каждому разделу параллельно. Как данные RDD распределяются по разделам, определяется Partitioner. По умолчанию используется HashPartitioner, который должен работать нормально для большинства целей.
Вы можете проверить, сколько разделов ваш РДД разделяется на использовании:
rdd.partitions // Array of partitions
Смежные вопросы
- 1. Есть ли способ проверить, является ли переменная Date в JavaScript?
- 2. Есть ли способ проверить, является ли переменная целым числом? C++
- 3. Семантический способ проверить, является ли переменная None
- 4. Есть ли быстрый способ проверить, является ли строка числовой?
- 5. Есть ли способ проверить, определена ли переменная в Java?
- 6. Velocity: Есть ли способ проверить, не определена ли переменная
- 7. Есть ли быстрый способ проверить, принадлежит ли переменная к набору?
- 8. Есть ли способ проверить, есть ли хост?
- 9. Есть ли способ проверить, является ли функция рекурсивной в python?
- 10. Есть ли способ проверить, является ли столбец виртуальным в java?
- 11. Есть ли способ проверить, является ли строка хешем MD5?
- 12. Есть ли способ проверить, является ли результат десятичным?
- 13. Есть ли способ проверить, является ли тип массива необязательным?
- 14. Есть ли способ проверить, является ли следующий токен КОНЕЦ?
- 15. Есть ли способ проверить, является ли столбец Date in R?
- 16. Есть ли рекомендуемый способ проверить, является ли смарт-указатель нулевым?
- 17. Есть ли способ проверить, является ли класс абстрактным?
- 18. Есть ли способ проверить, является ли тип типом перечисления?
- 19. Есть ли быстрый способ проверить, является ли ЛЮБАЯ колонка NULL?
- 20. Как проверить, есть ли переменная в списке?
- 21. Лучший способ проверить, является ли переменная функцией в javascript
- 22. Есть ли способ var_dump переменная?
- 23. Как проверить, является ли переменная инициализированной DataTable?
- 24. Есть ли способ проверить, создан ли SVG?
- 25. Как проверить, является ли переменная числовой?
- 26. Есть ли способ, что я могу сказать питона, чтобы проверить, является ли это переменная
- 27. jQuery - проверить, является ли переменная элементом dom
- 28. Typcript: Есть ли способ проверить, является ли переменная объектом, определенным интерфейсом, с вложенными свойствами?
- 29. Как проверить, является ли переменная объектом Moment.js?
- 30. Лучший способ проверить, является ли переменная целым числом
Можете ли вы сказать мне разницу между РДУ и pipelinedRDD, потому что, когда я пытаюсь вызвать метод разбиения, я получаю ошибку что pipelinedRDD не имеет функции разделов. – MetallicPriest
Похоже, что API Python не имеет метода 'rdd.partitions'. Попробуйте 'rdd.getNumPartitions', чтобы получить nr разделов. – maasg