Есть ли способ определить количество потоков cuda во время выполнения программы, а не при компиляции? Также как использование «новой» команды. (Далее «Поток» относится к блоку кодов, а не потоки)Есть ли способ динамически определить количество потоков cuda?
Редактировать 1
(В ответ на последний комментарий) Say
for(int i = 0; i < nstreams; ++i)
(Some serial code here, not related to kernel or cuda memory copy);
someKernel<<<xx, yy, 0, stream[i]>>>(param list);
end
Без последовательного кода, ядра должны выполняться в параллельно, если мое понимание правильное?
Но будет ли выполнение ядра одновременно, поскольку серийный код может быть распараллелен i (то есть может быть распараллелен в модуле OpenMP, если его вынуть). Будет ли это влиять на параллелизм?
Я просто попытался команду 'таНос', которая возвращает указатель марки 'cudaStream_t'. Код может компилироваться, но кажется немного странным. Будет ли тест проверять, правильно ли это выполняется. – Fontaine007