2015-12-31 3 views
-1

«nvprof --query-metrics» дает ошибку профилирования CUDA. Говорит, что не удалось найти какие-либо показатели. Как победить? Мой gpu - GTX 960. Операционная система Cent OS 6.5. Cuda 6.5, 64-разрядная версия Вот результат, полученный моей машиной.«nvprof --query-metrics» дает ошибку профилирования CUDA

[корень @ Sekhar finalCodes] # nvprof --query-метрики

Доступные показатели: Имя Описание Device 0 (GeForce GTX 960): ======== Ошибка: CUDA ошибки профилирования ,

[Root @ Sekhar finalCodes] # nvprof --analysis-метрики

======== Внимание: Метрика "stall_imc" не может быть найден на устройстве 0.

==== ==== Внимание: Метрика "stall_compute" не может быть найдено на устройстве 0.

======== Внимание: Метрика "stall_texture" не может быть найден на устройстве 0.

==== ==== Предупреждение: метрика «stall_other» не может быть найдена на устройстве 0.

======== Внимание: Метрика «stall_exec_dependency» не может быть найден на устройстве 0.

======== Внимание: Метрика «stall_inst_fetch» ​​не могут быть найдены на устройстве 0.

======== Предупреждение: метрическое значение «stall_sync» не может быть найдено на устройстве 0.

и многие другие подобные строки.

Все мои программы скомпилированы и выполнены отлично.

Также nvprof ./myFile дает следующий вывод.

== 4075 == Профилирование приложений: ./myFile

== 4075 == Профилирование результат:

Время (%) Время вызовов Avg Min Max Имя

99,94% 71.093ms 500 142.19us 135.17us 146.46us недействительными collideKernel (содой, Int, Int, Int)

0,05% 37.151us 9 4.1270us 3.9990us 4.5120us [CUDA тетсру HtoD]

0,01% 7.7760us 2 3.8880us 3.8720us 3.9040us [CUDA тетсру DtoH]

== 4075 == вызовы API:

Время (%) Время вызовов Avg Min Max Имя

75,44% 285.43ms 18 15.857 мс 4.3210us 285.35ms cudaMallocPitch

19,14% 72.422ms 1000 72.421us 1.1560us 218.21us cudaEventSynchronize

3,30% 12.491ms 1000 12.490us 706ns 11.523ms cudaEventCreate

0.87% 3.3010ms 500 6.6010us 5.9150us 37.636us cudaLaunch

0,49% 1.8493ms тысячу 1.8490us 1.4670us 22.908us cudaEventRecord

0,17% 660.35us 500 1.3200us 1.1920us 4.1100us cudaEventElapsedTime

0,15% 579.85us 83 6.9860us 445ns 264.17us cuDeviceGetAttribute

0,15% 575.57us 1 575.57us 575.57us 575.57us cudaGetDeviceProperties

0,11% 422.92us 2000 211ns 169ns 2.9590us cudaSetupArgument

0,06% 220.54us 11 20.048us 12.854us 62.371us cudaMemcpy2D

0,04% 158.03us 18 8.7790us 3.3490us 81.821us cudaFree

0,04 % 155.07us 500 274ns 1.9820us 310 нс cudaConfigureCall

+0

Какие показатели вы пытаетесь запросить? – talonmies

+2

У меня есть gtx 960 с CUDA 7.5 на linux, и у меня нет проблем с запуском 'nvprof -query-metrics'. Если вам нужна помощь, вам, вероятно, придется предоставить дополнительную информацию. Мое предложение было бы дать ответы на каждое из следующих вопросов (вы можете отредактировать свой вопрос): 1. Какую ОС вы используете? 2. Какую версию CUDA вы используете? 3. Можете ли вы правильно использовать коды CUDA на вашем GTX960, например, коды образцов 'deviceQuery' и' vectorAdd'? 4. Укажите точную команду 'nvprof' и выведите ее из этой команды (скопируйте и вставьте свою сессию в вопрос). –

+0

попробуйте обновить версию CUDA с 6.5 до 7.5. Убедитесь, что у вас установлен правильный драйвер для CUDA 7.5 i.e. 352.xx или новее. –

ответ

1

С NVIDIA Driver 352.63 и Cuda 7.5.18, показатели доступны только очень немногих показателей, как

"l1_shared_utilization" 
"alu_fu_utilization" 
"l2_l1_read_transactions" 
"l2_l1_write_transactions" 
"nc_l2_read_transactions" 
"l2_l1_read_throughput" 
"l2_l1_write_throughput" 
"nc_l2_read_throughput" 
"atomic_throughput". 

Новые версии драйверов и инструментальных средств предоставляют события и показатели.

+0

Нет такой вещи, как CUDA 7.8. – talonmies

+0

Его в Cuda 7.5.18. –

Смежные вопросы