2017-02-13 3 views
2

Я запускаю модель обучения google cloud ml, и она занимает около 10 часов с некоторыми наивными догадками в формах машины. Я бы хотел немного оптимизировать его, чтобы сократить время работы и общую стоимость.Как собрать показатели производительности из запущенных учебных заведений Google Cloud?

Каков наилучший способ определить, эффективно ли я использую ресурсы? Я бы хотел, чтобы измерения процессора, давления памяти и использования графического процессора (когда они доступны). Я подозреваю, что мне нужно либо 1) зарегистрировать их, либо 2) установить агент мониторинга, например, драйвер стека, и предположить, что такие вещи, как nvidia-smi, являются локальными, но мне интересно, если кто-то попытался.

ответ

1

Эта функция теперь встроена в продукт - метрики использования процессора и ОЗУ (пока) публикуются как метрики Stackdriver.

Вид метрики также отображается в консоли на странице сведений о задании.

Надеюсь, что это поможет.

Смежные вопросы