2016-12-16 2 views
0

Я тренирую модель в облаке с Cloud ML из ноутбука Cloud Datalab. Я хотел бы оценить модель локально.Tensorflow/Cloud Datalab: Восстановить вызванный с недействительным дорожкой сохранения

%mlalpha train 
package_uris: $package_path_local 
python_module: trainer.task 
args: 
    eval_data_paths : ...# local or gs:// 

все случаи I (локальных или удаленных я получаю следующее сообщение об ошибке:

Restore called with invalid save path: u'[path to checkpoint file]'. File path is: u'[path to checkpoint file]' 

Однако оценки на облаке работает отлично Tensorflow версии в последнее Облако Datalab является 0.11rc0

ответ

0

Вы были. команда «% mlalpha train», так что это тренировка, но не оценка? Или ваш код в учебном пакете пытается загрузить контрольный пункт?

Когда оценка ион работал в облаке, какую команду вы запустили?

+0

Если данные о тренировке не отправляются, он пропускает eval-pass по файлам 'eval_data_paths', используя код, который выполняет периодические оценки проверки, установленной во время обучения. Проблема заключается в том, что [журналы разбиты в облаке] (http://stackoverflow.com/a/41185588?noredirect=1), поэтому мне нужно запустить eval local – znat

+0

. Кажется, что наблюдается изменение поведения в тензорном потоке между версией в Datalab и версии, запущенной в сервисе. Попробуйте обновить shadoworflow до: http://ci.tensorflow.org/view/Release/job/release-debian-cpu/lastSuccessfulBuild/artifact/pip_test/whl/tensorflow-0.12.0-cp27-none-linux_x86_64.whl. (запустите! pip install [url] в ячейке) и посмотрите, работает ли он сейчас. –

1

Возможные проблемы:

  1. ваша модель обучения график и модель оценки графа различны. Убедитесь, что вы используете ту же модель.

  2. Вы подготовили модель, затем сменили модель и попытались снова тренироваться или оценивать. Возможно, вам придется удалить каталог контрольной точки, чтобы все начиналось заново.

Смежные вопросы