Есть ли способ запустить событие (для целей сравнения, аналогично cudaEvents в коде CPU) из ядра устройства в CUDA?CUDA - событие изнутри ядра
E.g. предположим, что я хотел бы измерить время, прошедшее с начала ядра, на первый поток, когда-либо начинающий вычисление, и время, прошедшее с последнего потока, который возвращает вычисление к возврату ЦП.
Могу ли я это сделать?