У меня огромные огромные матрицы, и я хочу, чтобы выход матрицы был того же размера, что и входная матрица, только с каждой ячейкой, получающей сумму чисел из соседней ячейки.Проблема с добавлением матрицы GPGPU
Можете ли вы посоветовать мне, как подойти к нему на платформе GPGPU, используя CUDA?
Что реализация? OpenCL, Cuda, DirectX, OpenGL, DirectCompute, Matlab? Если вы не зададите вопрос, я сомневаюсь, что кто-то сможет помочь. –