2014-02-21 4 views
0

Я хотел бы сделать булевское умножение с помощью cuda 6, но я не могу сделать это правильно. B - булева симметричная матрица, и я должен делать B^n булево умножение.Булево умножение

код

My C++ является:

for (m=0; m<dimension; m++) { 
    for (n=0; n<dimension; n++) { 
     for (k=0; k<dimension; k++) { 
      temp=mat[m*dimension+k] && mat[k*dimension+n]; 
      B[m*dimension+n]= B[m*dimension+n] || temp; 
     } 
    } 
} 

Я нашел кусок кода, но я не могу приспособить его для моего случая.

__global__ void gpuMM(float *A, float *B, float *C, int N) 
{ 
    int row = blockIdx.y*blockDim.y + threadIdx.y; 
    int col = blockIdx.x*blockDim.x + threadIdx.x; 

    float sum = 0.f; 
    for (int n = 0; n < N; ++n) 
     sum += A[row*N+n]*B[n*N+col]; 

    C[row*N+col] = sum; 
} 
+1

Хотя это не будет эффективной матрицейMul, но это прямолинейно. Поместите внутренний цикл вашего кода вместо цикла в ядре. Также замените 'sum',' row', 'col' и' N', с 'temp',' m', 'n' и' dimension'. – ahmad

+0

То, что вы делаете, является регулярным умножением 'B = A * transpose (A)'. '&&' эквивалентен '*', а '||' эквивалентен '+'. Просто используйте cublas для умножения этих двух матриц. В случае, когда A является логическим, сначала конвертируйте его в float. –

ответ

0

Используя обозначение для вашего ядра для первой части кода, вы получаете это.

for (row=0; row<N; row++) { 
    for (col=0; col<N; col++) { 
     for (n=0; n<N; n++) { 
      temp=mat[row*N+n] && mat[n*N+col]; 
      B[row*N+col] = B[row*N+col] || temp; 
     }  
    } 
} 

Так что ваше ядро ​​должно быть что-то вроде этого:

__global__ void gpu_booleanMM(char *mat, char *B, int N) 
{ 
    int row = blockIdx.y*blockDim.y + threadIdx.y; 
    int col = blockIdx.x*blockDim.x + threadIdx.x; 

    for (int n=0; n<N; n++) { 
     temp=mat[row*N+n] && mat[n*N+col]; 
     B[row*N+col] = B[row*N+col] || temp; 
    } 
} 

Я сомневаюсь, что это очень эффективно, но что-то подобное должно все-таки дать правильный результат.

Смежные вопросы