В настоящее время я обрабатываю данные, используя секцию spark и foreach, открывая соединение с mysql и вставляя его в базу данных в партии 1000. Как указано в значении по умолчанию SparkDocumentationspark.sql.shuffle.partitions
- 200, но я хочу сохранить его динамичным. Итак, как я его вычисляю. Следовательно, при выборе очень высокого значения, вызывающего ухудшение производительности, или при выборе очень маленького значения, вызывающего OOM
.Как динамически выбирать spark.sql.shuffle.partitions
4
A
ответ
-2
Вы можете использовать df.repartition (numPartitions) способ для этого. Вы можете принять решение на основе входного/промежуточного вывода и передать numPartitions в метод repartition().
df.repartition(numPartitions) or rdd.repartition(numPartitions)
Смежные вопросы
- 1. Как динамически выбирать хранилище
- 2. Как динамически выбирать внутри процедуры
- 3. Как динамически выбирать в запросе
- 4. Oracle: динамически выбирать скрипт
- 5. Динамически выбирать базы данных
- 6. Scala - динамически выбирать функции
- 7. XSL: динамически выбирать узлы
- 8. динамически выбирать поля в LINQ
- 9. Динамически выбирать переменную в цикле
- 10. Как динамически выбирать URI для службы WCF?
- 11. Как динамически выбирать контроллер в MVC Core
- 12. ZF2 как динамически выбирать модули/контроллеры
- 13. Как динамически выбирать имена столбцов в mySQL
- 14. Как динамически выбирать нужные столбцы в Laravel
- 15. Как добавить динамически выбирать псевдонимы в запросе
- 16. Как динамически выбирать предыдущий элемент родственного брата
- 17. Как динамически выбирать текст из EditText OnClickListener?
- 18. Как динамически выбирать поля (LOOP) в PLSQL?
- 19. Как динамически выбирать опцию для динамически добавленного выбора/опции тега
- 20. Динамически выбирать столбцы в модели Azure ML
- 21. динамически выбирать несколько опций в поле выбора
- 22. динамически выбирать строки/столбцы в excel
- 23. динамически выбирать IEnumerable свойства в C#
- 24. JQuery UI - динамически выбирать конкретные вкладки
- 25. Динамически выбирать ячейку внутри Для оператора
- 26. Динамически выбирать столбец для запроса в Redshift
- 27. Динамически выбирать, какой класс использовать в функции
- 28. Выбирать динамически с помощью настраиваемого рендеринга
- 29. динамически выбирать варианты множественного выбора из MySQL
- 30. JQM Custom Выберите не выбирать динамически элементы
Нет, это не работает: df.repartition (numPartitions) – tauitdnmd