Я хотел бы сделать булевское умножение с помощью cuda 6, но я не могу сделать это правильно. B - булева симметричная матрица, и я должен делать B^n булево умножение.Булево умножение
кодMy C++ является:
for (m=0; m<dimension; m++) {
for (n=0; n<dimension; n++) {
for (k=0; k<dimension; k++) {
temp=mat[m*dimension+k] && mat[k*dimension+n];
B[m*dimension+n]= B[m*dimension+n] || temp;
}
}
}
Я нашел кусок кода, но я не могу приспособить его для моего случая.
__global__ void gpuMM(float *A, float *B, float *C, int N)
{
int row = blockIdx.y*blockDim.y + threadIdx.y;
int col = blockIdx.x*blockDim.x + threadIdx.x;
float sum = 0.f;
for (int n = 0; n < N; ++n)
sum += A[row*N+n]*B[n*N+col];
C[row*N+col] = sum;
}
Хотя это не будет эффективной матрицейMul, но это прямолинейно. Поместите внутренний цикл вашего кода вместо цикла в ядре. Также замените 'sum',' row', 'col' и' N', с 'temp',' m', 'n' и' dimension'. – ahmad
То, что вы делаете, является регулярным умножением 'B = A * transpose (A)'. '&&' эквивалентен '*', а '||' эквивалентен '+'. Просто используйте cublas для умножения этих двух матриц. В случае, когда A является логическим, сначала конвертируйте его в float. –