Я прочитал документацию и книги (также эти посты: OpenCL: query number of processing elements; Understanding work-items and work-groups; OpenCL: Work items, Processing elements, NDRange) о модели выполнения и теории о разделении данных с помощью NDrange.Как использовать NDrange на практике?
Я строю свои рабочие элементы и рабочие группы на основе моего оборудования? Если да, то как я могу запросить, сколько рабочих элементов и рабочих групп доступно на устройстве? Есть ли хорошая практика, как разделить рабочие предметы и рабочие группы для достижения хорошей производительности?
Я хотел бы знать, как они работают и взаимодействуют на практике, для вычисления одномерного массива и для двумерного массива, такого как изображение.