Я работаю на Arch Linux:Блокировка вызова ядра CUDA?
Я читал в нескольких местах, что вызов ядра асинхронен по отношению к ЦП (немедленно вернется и позволит ЦП продолжать). Однако я не получаю такого поведения.
например.
kernel<<<blocks,threads>>>();
printf("print immediately\n");
check_cuda_error();
CPU кажется запереться и ничего не печатается (также ничего не выполняется) на консоль, пока ядро не будет завершено. Протестировано ядрами разного времени исполнения (1s, 2s, 3s и т. Д.) И вычислениями, чтобы убедиться, что это не мое ядро.
Это проблема с драйвером? Или я неправильно истолковываю что-то