Я знаю, что конструктор make_float4 находится в vector_functions.h, но который является файлом заголовка, который реализует операцию float4 в CUDA?Какой файл заголовка реализует операцию float4 в CUDA?
Спасибо.
Я знаю, что конструктор make_float4 находится в vector_functions.h, но который является файлом заголовка, который реализует операцию float4 в CUDA?Какой файл заголовка реализует операцию float4 в CUDA?
Спасибо.
Я не считаю, что это стандартный файл заголовка CUDA (то есть один, который будет найден nvcc
автоматически, например, в /usr/local/cuda/include
), который реализует различные float4
операторов.
Однако «помощник» файл заголовка по адресу:
/usr/local/cuda/samples/common/inc/helper_math.h
(пример пути на Linux), который получает установлен с образцами Cuda, определяет число арифметических операторов на float4
количествах.
Да. Они определили некоторые служебные операции в helper_math.h, и я использовал его в своем проекте. Еще раз спасибо. –
Как мы можем быть уверены, что получаем (например) аппаратные ускоренные точечные продукты, используя этот файл заголовка? – wcochran
Я хочу убедиться, что я сгенерировал правильную инструкцию PTX, например, dp4a http://docs.nvidia.com/cuda/parallel-thread-execution/index.html#integer-arithmetic-instructions-dp4a – wcochran
Некоторые операторы 'float4' (+, -, *, + =, - = и т. Д.) Определены в'/usr/local/cuda/samples/common/inc/helper_math.h', однако это не считается стандартным файлом заголовка CUDA. Это часть пакета образцов. –
@RobertCrovella Спасибо. –