Какой файл заголовка реализует операцию float4 в CUDA?

Я знаю, что конструктор make_float4 находится в vector_functions.h, но который является файлом заголовка, который реализует операцию float4 в CUDA?Какой файл заголовка реализует операцию float4 в CUDA?

Спасибо.

источник

2014-01-18 G_fans

Некоторые операторы 'float4' (+, -, *, + =, - = и т. Д.) Определены в'/usr/local/cuda/samples/common/inc/helper_math.h', однако это не считается стандартным файлом заголовка CUDA. Это часть пакета образцов. –

@RobertCrovella Спасибо. –

Я не считаю, что это стандартный файл заголовка CUDA (то есть один, который будет найден nvcc автоматически, например, в /usr/local/cuda/include), который реализует различные float4 операторов.

Однако «помощник» файл заголовка по адресу:

/usr/local/cuda/samples/common/inc/helper_math.h

(пример пути на Linux), который получает установлен с образцами Cuda, определяет число арифметических операторов на float4 количествах.

источник

2014-01-21 05:40:04

Да. Они определили некоторые служебные операции в helper_math.h, и я использовал его в своем проекте. Еще раз спасибо. –

Как мы можем быть уверены, что получаем (например) аппаратные ускоренные точечные продукты, используя этот файл заголовка? – wcochran

Я хочу убедиться, что я сгенерировал правильную инструкцию PTX, например, dp4a http://docs.nvidia.com/cuda/parallel-thread-execution/index.html#integer-arithmetic-instructions-dp4a – wcochran

Какой файл заголовка реализует операцию float4 в CUDA?

ответ

Смежные вопросы