OpenCl clEnqueueMapBuffer работает неправильно?

Насколько я знаю, вы можете использовать clEnqueueMapBuffer для доступа к объектам памяти. Вместо использования операций чтения/записи вы можете сопоставить объект памяти на устройстве с областью памяти на хосте. Я написал очень простой код, чтобы проверить его. этот код отправляет чартер «X» на GPU, и ядро добавляет 1 к нему, поэтому мы должны получить «Y», но я этого не делаю. Кажется, что clEnqueueUnmapMemObject не копирует результат, который хранится в памяти графического процессора в буфер на хосте! это мой код:OpenCl clEnqueueMapBuffer работает неправильно?

#include <iostream> 
#include <CL\cl.h> 
using namespace std; 
#pragma warning(disable : 4996) 
#define PROGRAM "__kernel void hello(__global char* string)\ 
{\ 
string[0] = string[0] + 1;\ 
}" 

int main() { 
cl_platform_id platform; cl_device_id device; cl_context context; 
cl_program program; cl_int error; cl_build_status status; 

char *programBuffer = PROGRAM; 

// make contex 
clGetPlatformIDs(1, &platform, NULL); 
clGetDeviceIDs(platform, CL_DEVICE_TYPE_GPU, 1, &device, NULL); 
context = clCreateContext(NULL, 1, &device, NULL, NULL, NULL); 

//built program 
program = clCreateProgramWithSource(context, 1, (const char**)&programBuffer, nullptr, NULL); 
const char options[] = "-cl-std=CL1.1 -cl-mad-enable -Werror"; 
error = clBuildProgram(program, 1, &device, options, NULL, NULL); 

// create kernel 
cl_command_queue command_queue; 
command_queue = clCreateCommandQueue(context, device, NULL, nullptr); 
cl_kernel kernels, found_kernel; 
cl_uint num_kernels; 

error = clCreateKernelsInProgram(program, 0, nullptr, &num_kernels); 
kernels = clCreateKernel(program, "hello", nullptr); 
//make buffers 
cl_mem memobj = clCreateBuffer(context, CL_MEM_ALLOC_HOST_PTR| CL_MEM_READ_WRITE, 2 * sizeof(char), nullptr, &error);//if nulptr nazarim then itt will retun null pointer 
error = clSetKernelArg(kernels, 0, sizeof(cl_mem), (void *)&memobj); 
// I am goign to send this data to GPU 
char *CPU_2_GPU_Data = new char[2]{ "X" }; 
void* mapbuffer =clEnqueueMapBuffer(command_queue, memobj, CL_TRUE, CL_MAP_READ | CL_MAP_WRITE, 0, 2 * sizeof(char), 0, nullptr, nullptr, &error); 
memccpy(mapbuffer, CPU_2_GPU_Data, 0, 2 * sizeof(char)); 
cout<<"I am sending this dat to GPU:"<<(char*)(mapbuffer)<<endl; 
error = clEnqueueTask(command_queue, kernels, 0, nullptr, nullptr); 
clEnqueueUnmapMemObject(command_queue, memobj, mapbuffer, 1, nullptr, nullptr); 
cout << "I am getiing this data from GPU:" << (char*)(mapbuffer) << endl; 
clReleaseContext(context); 
return 0;

}

на самом деле я могу отправить данные на GPU с использованием объектов Mapping памяти, но я не могу прочитать результат. чтобы сделать работу с кодом, я должен явно запросить у GPU данные как:

char* newbuffer = new char[2]; 
clEnqueueReadBuffer(command_queue, memobj, CL_TRUE, 0, 2 * sizeof(char), newbuffer, 0, nullptr, nullptr); 
cout << "the result is :" << newbuffer << endl;

Почему это происходит ?? почему я могу отправлять данные на GPU, используя объекты памяти Mapping, но я не могу вернуть результат?

источник

2016-09-13 MEMS

Какой графический процессор вы используете? – Jovasa

@Jovasa Я использую AMD Radeon R7 M270 и есть Intel (R) HD Graphics 5500, а также – MEMS

Цель состоит в том, чтобы: 1) Карта, чтобы прочитать ее на хосте. 2) Затем вы удалите его, чтобы графический процессор мог снова использовать его. 3) Затем вы затем перепечатаете его, чтобы прочитать его с хоста. 4) Затем отмените его, чтобы очистить.

Кажется, что вы выполняете картографирование, запускаете задачу и затем разворачиваете. Таким образом, в момент, когда вы пытаетесь прочитать данные, хост фактически не может читать его больше, потому что вы просто его отключили!

источник

2016-09-13 20:13:14 Lee

за ваш ответ! Если я не отменил выбор буфера, я по-прежнему получаю неправильные результаты! на основе того, что вы сказали, что я должен 1-Map 2-Unmap 3-Run ядро 4-карта снова 5-данные теперь переданы для размещения 6-Unmap правильно? – MEMS

Справа. Вам нужно прочитать его на хосте, пока он отображается, и прочитать его на устройстве, пока он не отображается. Поэтому, если вы не отмените его, тогда графический процессор не сможет его прочитать, так что это тоже не сработает. – Lee

Я попробовал, но это не сработало! У вас есть пример, который я могу попробовать? – MEMS

OpenCl clEnqueueMapBuffer работает неправильно?

ответ

Смежные вопросы