2014-01-10 2 views
0

Я пытаюсь понять разницу между различными доменами событий, используемыми в nvprof.Понимание доменов событий nvprof

при попытке

nvprof --devices 0 --query-events 

В нем перечислены доступные события разделены на несколько областей (в домене DOMAIN_A, домене DOMAIN_B, domain_c, domain_d и т.д ...)

Я прочитал, что в зависимости от области, это зависит от того, подсчитывается ли событие для всех SM или немногих из них. Но я не мог узнать события, в которых домен подсчитывается для всех, и т. Д.

Было бы здорово, если кто-то может объяснить домены.

ответ

1

В nvprof по умолчанию события профилируются для всех экземпляров, которые могут быть профилированы, и данные экстраполируются для всех доступных экземпляров. Если все имеющиеся экземпляры не могут быть профилированные из-за аппаратных ограничений, то nvprof дает следующее предупреждение:

== 14882 == Внимание: следующие агрегатные значения событий были экстраполированы из данных ограниченного профиля и, следовательно, могут быть неточными. Чтобы просмотреть значения неагрегатных событий, используйте «-ggregate-mode off».

Если все доступные экземпляры могут быть профилированы, вы не увидите это сообщение.

Вы можете дать --aggregate-mode off опцию до --events для профильных событий для всех экземпляров домена. например:

./nvprof --aggregate режим от --events warps_launched ./matrixmul

В будущих версиях будет представлена ​​информация о профилированных экземплярах и доступных экземплярах для домена в --query-events опции ,

+0

Не могли бы вы объяснить, что означает «экземпляр»? – warunapww

Смежные вопросы