Я пытаюсь использовать динамический параллелизм Кеплера для одного из моих приложений. Глобальный индекс потока (в родительском ядре), запускающий дочернее ядро, необходим в дочернем ядре. Другими словами, я хочу получить доступ к встроенным координатным переменным родителя в дочернем ядре.Доступ к встроенной переменной CUDA в дочернем ядре
Есть ли канонический способ сделать это? Или я должен просто вычислить глобальный индекс родительского потока (используя встроенные переменные, такие как threadIdx.x и т. Д.) И передать его через один аргумент дочернего ядра?
Ударьте меня в это. Передача структуры threadIdx и blockIdx dim3 по значению является самым простым способом, я думаю – talonmies