Я сомневаюсь, правильно ли настроен тензор на моем поле gpu, так как он приблизительно на 100 раз медленнее на итерацию для обучения простой модели линейной регрессии (batchsize = 32, 1500 входных функций, 150 выходных переменных) на моей модной машине gpu, чем на моем ноутбуке.тест скорости для тестирования тензорного потока
Я использую Titan X с современным процессором и т. Д. Nvidia-smi говорит, что я использую только 10% загрузки gpu, но я ожидаю, что это из-за небольших партийных файлов. Я не использую feed_dict для перемещения данных в граф вычислений. Все идет через tf.decode_csv и tf.train.shuffle_batch.
Есть ли у кого-нибудь рекомендации относительно того, как легко проверить, правильно ли установлена моя установка? Есть ли простые контрольные показатели скорости? Разница в скорости между моим ноутбуком и машиной gpu настолько драматична, что я ожидаю, что все будет неправильно настроено.
Некоторые примеры не оптимизированы для GPU и может получить 100x медленнее, когда GPU включен из-за копий, вот один протокол HTTPS: //github.com/tensorflow/tensorflow/issues/838 –