Так что, если потоковый мультипроцессор может разрешать максимальные потоки X, тогда как каждый блок в SM разрешает Y-потоки, сколько бит может быть у нас в блоке и сколько деформаций мы можем иметь в SM?Определение количества разрежений, разрешенных в CUDA SM
Вот мой взгляд на этот вопрос:
(1) Основовязальная состоит из 32 нитей. В блоке мы можем иметь Y/32, верно?
(2) Что касается № перекосов на SM, мы не можем превышать X максимальное количество потоков в SM, поэтому у нас может быть X/32, правильно? Надеюсь, кто-то сможет подтвердить эти расчеты.
Да, вы были бы ограничены одним блоком за раз в этом случае –
Спасибо. Я просто пытался понять различное состояние. Большое спасибо Роберту. – user2403623