2016-06-16 4 views
0

вот моя вкладка исполнителя искровых заданий на искровом пользовательском интерфейсе, не знаете, почему так много задач у одного исполнителя, может кто-нибудь объяснить, пожалуйста.Задание исполнителя/задание задания

enter image description here

Кроме того, на рисунке почему так много различий в количестве созданных задач 17/17,20/20 и т.д., можно использовать правильное количество ядер, если я знаю, сколько такое же количество задач создаются enter image description here Пожалуйста, советы

ответ

0

Я предполагаю, потому что Искра реализовать 1 из ваших узлов ближе, чем другие, так что ближайший исполнитель будет делать все дела.

Так что вы попытаетесь увеличить spark.locality.wait до 10 или 15, потому что по умолчанию 3s. Но нужно подтвердить, посмотрите что-нибудь подобное? enter image description here

Но это не лучший способ сделать. Вам нужно переместить свой источник данных ближе к вашему исполнителю, потому что стоимость сетевой передачи стоит дорого.

Ref: http://spark.apache.org/docs/latest/configuration.html#scheduling

+0

спасибо человеку, все еще нужно сделать некоторые исследования, я думаю. – Bill