В качестве абстрактной концепции параллельных вычислений локальная (общая) память выделяется для блоков потоков (CUDA)/рабочих групп (OpenCL) и распределяется между всеми потоками в тех же блоках потоков (CUDA)/Workgroups (OpenCL).Как распределяется локальная (общая) память?
Как это фактически выделяется? выделяется ли он первым потоком блока/группы или выделяется до создания блоков контроллером памяти? или что-то другое ?
@DarkZeros: Этот комментарий, вероятно, достаточный ответ, если вы хотите добавить его как один – talonmies
@DarkZeros Спасибо, это объясняет это очень хорошо – OmarGW