Какова формула, которую Spark использует для вычисления количества задач сокращения?Число задач сокращения Spark
Я запускаю несколько запросов spark-sql, и количество задач сокращения всегда равно 200. Количество задач карты для этих запросов - 154. Я нахожусь на Spark 1.4.1.
Является ли это связано с spark.shuffle.sort.bypassMergeThreshold, который по умолчанию 200