Spark --num-исполнители и количество разделов

Выполняется ли количество исполнителей как фактор количества разделов. Поскольку я получаю потерю данных при наличии двух исполнителей и 25 разделов.Spark --num-исполнители и количество разделов

источник

2016-02-18 SChorlton

Совсем нет! Количество разделов полностью не зависит от количества исполнителей (хотя для производительности вы должны хотя бы установить количество разделов как количество ядер на каждый исполнитель за раз число исполнителей, чтобы вы могли использовать полный параллелизм!).

Возможно, вы сможете оставить свой код, чтобы мы могли определить причину потери данных ...

источник

2016-02-18 16:43:18

Spark --num-исполнители и количество разделов

ответ

Смежные вопросы