Возможно ли, что потоки занимают больше времени, чем обычные программы CUDA? Гарантируется, что часть данных о том, какие потоки работают, независимы, и перекрытие между выполнением ядра и передачей данных разрешено со стороны устройства.Потоки CUDA, занимающие более длительное время
0
A
ответ
1
Чтобы наблюдать за суперпозициями между потоками, вы должны использовать профилировщик командной строки с опцией conckerneltrace
. Вы также можете сохранить выходной файл профилирования как CSV-файл и импортировать его в Visual Profiler. Смотрите NVIDIA пост на форуме
Смежные вопросы
- 1. MongoDB AggregationOutput более длительное время ответа
- 2. Назначение автозаполнения, создающее более длительное время работы
- 3. Более длительное время выполнения запросов Sql-сервер
- 4. Отображение iOS LaunchScreen на более длительное время
- 5. CUDA - Блоки и потоки
- 6. CUDA параллельные потоки
- 7. Как работают потоки CUDA
- 8. CUDA: синхронизирующие потоки
- 9. CUDA не запускает потоки?
- 10. SocketChannel connect занимает длительное время
- 11. Laravel - Длительное время инициализации
- 12. Ivy repreport длительное время
- 13. Сбор мусора Java - Шипы ЦП - Более длительное время установления соединения
- 14. Поиск в регулярном выражении все более длительное время
- 15. Android AlarmManager не работает при установке на более длительное время
- 16. Потоки глобальной памяти и CUDA
- 17. Как Tensorflow поддерживает потоки Cuda?
- 18. Потоки CUDA кажутся не синхронизированными
- 19. Время запроса в MongoDB длительное время?
- 20. Очень длительное время запроса VS2010
- 21. Предварительная оценка SSIS занимает длительное время
- 22. Длительное ядро cuda прекращается, когда TDR срабатывает в
- 23. Потоковые мультипроцессоры, блоки и потоки (CUDA)
- 24. CUDA транспонировать более одного потока
- 25. TFS Build занимает длительное время
- 26. Очень длительное время сбора мусора
- 27. iOS: обнаружение маяков длительное время
- 28. Медленный jQuery - длительное время загрузки?
- 29. opencl длительное время выполнения ядра
- 30. NHibernate + Свободное длительное время запуска
Вы работаете в профилировщике? Профилировщик выполняет сериализацию всех вызовов. –
Возможный дубликат [Можем ли мы получить увеличение производительности с потоками CUDA?] (Http://stackoverflow.com/questions/8284680/can-we-really-get-performance-gain-with-cuda-streams) – talonmies
@RogerDahl Как установить профайлер в Linux? –