This link говорит, что подпрограммы cuBLAS-XT обеспечивают работу вне ядра - размер данных операнда ограничен только размером системной памяти, а не объемом встроенной памяти GPU. Это означает, что до тех пор, пока входные данные могут быть сохранены в памяти процессора, а размер вывода больше, чем размер памяти GPU, мы можем использовать функции cuBLAS-XT, правильно?Использование cuBLAS-XT для большого размера ввода
С другой стороны, this link говорит: «В случае очень больших проблем API-интерфейс cublasXt предлагает возможность выгрузить часть вычислений в центральный процессор хоста» и «Currenty», только подпрограмма cublasXtgemm() поддерживает эту функцию . является ли это в случае проблем, размер входного сигнала больше, чем размер памяти CPU?
Я не понимаю разницу между этими двумя! Я признателен, если кто-то помогает мне понять разницу.
http://stackoverflow.com/a/14558198/681865 – talonmies