Я пытаюсь скомпилировать код CUDA C для графического процессора с архитектурой sm_10
, который не поддерживает вызов malloc
из __global__
.Альтернативы malloc для распределения динамической памяти в функциях ядра CUDA
Мне нужно сохранить дерево, для которого узлы создаются динамически в памяти графического процессора. К сожалению, без malloc
, видимо, я не могу этого сделать.
Есть ли способ скопировать все дерево с помощью cudaMalloc
? Я думаю, что такой подход просто скопирует корень моего дерева.
Можете ли вы показать свой код, пожалуйста? – StormeHawke
Последняя часть вашего вопроса не очень понятна. Что вы подразумеваете под _copy для всего дерева с помощью 'cudaMalloc'_? 'cudaMalloc' используется только для выделения памяти. Не могли бы вы также объяснить, почему вы ожидаете, что с помощью 'cudaMalloc' вы сможете копировать корень своего дерева? – JackOLantern