Каков наилучший способ умножить каждый 32-разрядный ввод двух регистров _mm256i
друг на друга?Умножить два вектора из 32-битных целых чисел, создавая вектор из 32-битных элементов результата
_mm256_mul_epu32
не то, что я ищу, потому что он производит 64-битные выходы. Я хочу получить 32-битный результат для каждого 32-битного элемента ввода.
Кроме того, я уверен, что умножение двух 32-битных значений не будет переполняться.
Спасибо!
Возможный дубликат [быстрый способ умножить два вектора в C++] (http://stackoverflow.com/questions/17264399/fastest-way-to-multiply-two-vectors-in-c) –