2016-09-21 2 views
7

Как мы можем получить общую память, используемую для искровой работы. Я не могу получить точный параметр, к которому мы можем обратиться, чтобы получить то же самое. Относились к Spark UI, но не уверены в области, которую мы можем отнести. Кроме того, в ганглиях мы имеем следующие варианты: а) Memory Buffer б) Кэш-память с) Свободной памятью d) Shared Memory е) Свободное пространство подкачкиМониторинг использования памяти искровых заданий

не в состоянии получить любой вариант, связанный с памятью Используется. Есть ли у кого-нибудь идеи относительно этого.

ответ

0

Если вы сохраняете свои RDD, вы можете видеть, насколько они велики в памяти через пользовательский интерфейс.

Трудно понять, сколько памяти используется для промежуточных задач (например, для перетасовки). В основном Spark будет использовать столько памяти, сколько ему нужно, учитывая то, что доступно. Это означает, что если ваши RDD занимают более 50% ваших доступных ресурсов, ваше приложение может замедлить работу, поскольку для выполнения ресурсов будет доступно меньше ресурсов.

+0

Спасибо за ваши данные. Да, мы сохраняли один из RDD на промежуточной стадии, но требование таково, что нам нужно вычислить «используемую память» или среднюю память, используемую в течение всего цикла работы. Можете ли вы представить информацию, если мы сможем ее получить, используя некоторый пользовательский интерфейс или некоторые другие инструменты. –

Смежные вопросы