Я читал некоторые результаты. И там я увидел, что они использовали 5120 рабочих-групп и местного размера 1. У меня есть ограниченные знания об OpenCL и мне было интересно, если это утверждение верно:Заявление OpenCl, истинное или ложное?
Как можно видеть на GPU, первый тест имеет 5120 рабочих групп, с 1 рабочий каждый. Это означает, что потоки, которые выполняются на этапе , ограничены количеством вычислительных блоков, которые находятся в машине . Например, если GPU имеет 20 вычислительных единиц, то может быть только не более 20 потоков, которые работают параллельно. Хотя, когда местного размера увеличен до 2, в два раза больше потоков выполняются одновременно
От чтения некоторой информации о OpenCL, кажется, о праве. Хотя мне нужно второе мнение.
Запланировано нормально, но работать одновременно Я не уверен ... –