Если у меня общая память 48 КБ на каждый SM, и я создаю ядро, в котором я выделяю 32 КБ в общей памяти, это означает, что только один блок может работать на одном SM одновременно.CUDA разделяемая память
ответ
Да, это правильно.
Общая память должна поддерживать «след» всех «резидентных» блоков резьбы. Для того, чтобы потоковый блок запускался на SM, для его поддержки должно быть достаточно разделяемой памяти. Если нет, он будет ждать завершения текущего исполняемого потокаблока.
Существует несколько нюансов для этого прибытия с Maxwell GPUs (cc 5.0, 5.2). Эти графические процессоры поддерживают 64 КБ (cc 5.0) или 96 КБ (cc 5.2) разделяемой памяти. В этом случае максимальная общая память, доступная для одного блока потоков, по-прежнему ограничена 48 КБ, но несколько блоков потоков могут использовать более 48 Кбайт в совокупности на одном SM. Это означает, что cc 5.2 SM может поддерживать 2 потоковых блока, даже если оба используют общую память 32 КБ.
- 1. Bank конфликт CUDA разделяемая память?
- 2. глобальная vs разделяемая память в CUDA
- 3. разделяемая память через компиляторы?
- 4. Что такое потенциально разделяемая память?
- 5. многопоточных сочетающие файлы (разделяемая память)
- 6. python: память, разделяемая между StringIO?
- 7. разделяемая память, MPI и системы очередей
- 8. наддув: разделяемая память и Сейнт типы
- 9. подталкивания разделяемая память не может быть инициализирована
- 10. ММФ (Exclusive/не разделяемая память отображается файл)
- 11. MPJ Java многоядерная конфигурация или разделяемая память?
- 12. Как проверить, пуста ли разделяемая память?
- 13. исключения наддува: межпроцессное, разделяемая память объектого удаление
- 14. cuda общая память перезаписывается?
- 15. Как управляется память CUDA?
- 16. CUDA. Общая память vs Константа
- 17. CUDA общая память проблемы понимания
- 18. CUDA закреплена память и коалесцирует
- 19. Cuda, унифицированная память, передача данных
- 20. Невозможно выделить общую память CUDA
- 21. CUDA: унифицированная память, используя массивы
- 22. Память CUDA для таблиц поиска
- 23. Прямая доступная память устройства CUDA
- 24. Прикрепленная память в Nvidia CUDA
- 25. CUDA глобальная память скорость доступа
- 26. cuda: Является ли общая память всегда полезной?
- 27. IPC и/или разделяемая память для Linux для новичков
- 28. Доступна ли разделяемая память Linux между C и C++?
- 29. Данные Гонки в режиме чтения openMP разделяемая память
- 30. разделяемая память между родителем и дочерним элементом в c
Почему нет 3 резьбовых блока в этом случае? – Seltymar
Возможно 3 резьбовых блока. –