Я прочитал пару вопросов по SO для этой темы (режим SIMD), но все же небольшое уточнение/подтверждение того, как все работает.SIMD-8, SIMD-16 или SIMD-32 в opencl на gpgpu
Why use SIMD if we have GPGPU?
SIMD intrinsics - are they usable on gpus?
Подписчиков точки правильно, если я компиляции кода в режиме SIMD-8? 1) это означает, что выполнение 8 команд разных рабочих элементов выполняется параллельно.
2) Означает ли это, что все рабочие элементы выполняют одну и ту же инструкцию?
3) если каждый код элемента wrok содержит нагрузку vload16, затем float16, а затем только операции vstore16. Режим SIMD-8 по-прежнему будет работать. Я хочу сказать, верно ли, что GPU до выполнения той же инструкции (либо vload16/float16/vstore16) для всех 8 рабочих элементов?
Как я должен понимать эту концепцию?
Интересный вопрос. Я никогда не слышал, чтобы кто-нибудь делал оптимизацию SIMD на GPU. – user3528438
Графические процессоры используют (почти) тот же SIMD, что и у процессоров - только модель программирования отличается, демонстрируя скалярные потоки на графическом процессоре и векторные потоки на процессоре. –
Любые комментарии к пункту 3) –