Предположим, что блок потока содержит 1000 потоков, а поточный мультипроцессор (SM) может выполнять только 500 потоков, тогда мой блок потоков должен быть сопоставлен с двумя или более SM. то как они могут получить доступ к общей памяти?в CUDA. Как блок потока получает сопоставление с SM
1
.
A
ответ
3
..... тогда мой блок нитей должен быть сопоставлен с 2 или более SM.
Неправильное. Блоки только когда-либо отображаются на один многопроцессор для их полного жизненного цикла. Невозможно разбить блок на несколько SM.
Если вы попытаетесь запустить ядро, где размер блока или требования к ресурсам превышают требования к многопроцессору, на котором он должен запускаться, запуск завершится неудачно, и ядро никогда не запустится.
Смежные вопросы
- 1. Cuda, определить последний блок на SM
- 2. Ограничение регистра Cuda SM
- 3. Определение количества разрежений, разрешенных в CUDA SM
- 4. Как SM в CUDA запускает несколько блоков одновременно?
- 5. Количество ядер на SM и потоки в блоке в CUDA
- 6. cuda streams: callback не получает вызов после выполнения потока
- 7. Cuda thread: специальное сопоставление/индексирование
- 8. Как работает блок управления сеткой в CUDA?
- 9. CUDA транспонировать более одного потока
- 10. Алгоритм сжатия потока CUDA
- 11. переключить блок фокус в cuda-cdb
- 12. Сопоставление данных потока с данными в C#
- 13. Преимущество использования потока CUDA
- 14. помогите мне понять cuda
- 15. Ошибка CUDA: MapSMtoCores undefined SM 3.5 не определено
- 16. Управление использованием в CUDA
- 17. BufferedReader - Блок в конце потока
- 18. Принуждение нить блок CUDA для получения
- 19. Cuda блок/размеры сетки: когда использовать dim3?
- 20. Сопоставление потока ввода XML с JCR
- 21. CUDA - больше SM или более высокая тактовая частота?
- 22. блок не получает казнены
- 23. как остановить изнутри блок потока в синатра?
- 24. Программным получает имя потока
- 25. Как вычислить экспоненту матрицы внутри потока CUDA?
- 26. Как использовать приоритет потока cuda на GTX970?
- 27. Используйте индекс потока CUDA как число
- 28. Нити на блок в CUDA 7
- 29. Обработка потока Cuda для нескольких ядер Несознание
- 30. Почему блок/индекс потока в cuda не похож на два размера массива в C?
Но как программист, как мы знаем, сколько потоков мы можем поместить в блок, чтобы он не превышал потоки SM? Поскольку ни один из потоков, выполняемых на SM, не зависит от архитектуры GPU. – Vamshi
Прочитав [документацию] (http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#compute-capabilities), где подробно описаны аппаратные ограничения для каждого поколения оборудования. И используя [калькулятор занятости] (http://stackoverflow.com/questions/15080248/cuda-occupancy-calculator), который поставляется в каждой версии инструментария CUDA. – talonmies
Кроме того, посмотрите на 'deviceQuery' [пример кода] (http://docs.nvidia.com/cuda/cuda-samples/index.html#utilities). –