2016-06-27 4 views
1

я имел обыкновение использовать хроны для моей резервной рутины, и все было в порядке:Как я могу узнать, почему работа Мезоса Хроноса терпит неудачу?

tar c --exclude=owncloud --exclude=hadoop -C /var/opt . | pigz -c -p 4 --best 
| hadoop fs -put - /apps/appBackups/myserver_var_opt_$(date +\%Y-\%m-\%d_\%H-\%M-\%S).tar.gz 

Когда я переехал его в Mesos Хронос, он начал неудачу время от времени, даже если я принудительно запустить его:

ssh [email protected] <<'ENDSSH' bash daily_opt_backup.sh ENDSSH 

Журналы mesos-master.INFO недостаточно описательны - они показывают состояние задачи (TASK_RUNNING, вызов ACKNOWLEDGE, TASK_FINISHED и UUID), но не причина сбоя задачи. Где я могу найти эту информацию?

+0

Вы можете найти стандартный вывод/STDERR задач в песочнице. Перейдите на главную страницу mesos и найдите интересные задачи, чтобы перейти к ее песочнице. – janisz

+0

@janisz есть очень общая информация, поскольку задача терпит неудачу, но сам Chronos этого не делает. –

ответ

0

Работа не выполняется, поскольку некоторые подчиненные устройства не имеют закрытых ключей для входа в систему с правами администратора. Надлежащим образом ставится скрипт для HDFS поэтому каждый Mesos-раб мог скопировать и запустить его:

hadoop fs -get /apps/utils/daily_opt_backup.sh && chmod +x daily_opt_backup.sh 
&& ./daily_opt_backup.sh 
Смежные вопросы