Возможно ли увидеть адрес глобальной памяти, к которому обращается поток во время выполнения?CUDA: адрес доступа к глобальной памяти
Я знаю, что это создаст много накладных расходов, но я хотел бы посмотреть, к каким элементам обращаются. Я думаю, это поможет мне понять, как реализуется механизм коалесценции.
спасибо.
Спасибо. Может быть, я могу просто сделать некоторую простую арифметику указателя, чтобы увидеть, когда доступ «не» объединен (например, без отдельных шагов и некоторые из них), и просто распечатайте это. – algoProg