Я выполняю задание на кластере (используя PBS), в котором заканчивается память. Я пытаюсь напечатать статус памяти для каждого узла отдельно, пока выполняется другое задание. Я создал сценарий оболочки и включил вызов этого скрипта из моего сценария отправки задания. Но когда я отправляю свою работу, это дает мне разрешение отклонить ошибку в строке, которая вызывает скрипт. Я не понимаю, почему я получаю эту ошибку.просмотр памяти в PBS
Во-вторых, я думал, что у меня может быть «свободное время» или «смотреть ps aux» в моем файле сценария, но теперь я думаю, что если это заставит мою поданную работу застрять в сценарии просмотра памяти и никогда не переходите к главной линии, которая вызывает мою параллельную программу.
В конце концов, как я могу добиться регистрации моей памяти в PBS для заданий, которые я отправляю. Мой код - это программа на C++, использующая библиотеку MRMPI (MPI MapReduce).
Вы используете исключительно узлы?Если это так, вы можете использовать информацию об использовании памяти, собранную самим PBS, что кажется намного проще, чем повторение этой функции в вашем скрипте. –
Как я могу получить доступ к информации, собираемой PBS? Также я не хочу только окончательную отчетность, мне нужно понять, как изменяется потребление памяти в течение периода запуска программы. Я хочу посмотреть, какая функция Map или Reduce в моей программе вызывает проблему. – armen
Увы, извините, я не проверял, какая информация доступна на выходе 'pbsnodes -a'. В поле «состояние» с крутящим моментом сообщается только среднее значение нагрузки, а в 'PBS Pro' сообщается только' assign.mem'. –