У меня есть кусок кода, который я пытался оптимизировать, однако я не могу найти SIMD/Вектор эквивалент umlal:Что такое неоновый эквивалент инструкции умла ARM?
umlal r1, r2, r3, r4
Такие выходы инструкции?
Спасибо!
У меня есть кусок кода, который я пытался оптимизировать, однако я не могу найти SIMD/Вектор эквивалент umlal:Что такое неоновый эквивалент инструкции умла ARM?
umlal r1, r2, r3, r4
Такие выходы инструкции?
Спасибо!
VMLAL.U32, вероятно, то, что вы ищете.
Обратите внимание, что просмотр списка встроенных функций иногда немного проще, если вы можете использовать прототип «С» и посмотреть, какие типы данных и т. Д. Некоторые из ссылок ARM NEON кажутся недостаточными в поиске вариантов.
http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0491c/BABDEAGJ.html
или
https://gcc.gnu.org/onlinedocs/gcc-4.3.2/gcc/ARM-NEON-Intrinsics.html
(только что видел комментарий bitbank в)
Спасибо :) Кончик подсказки полезен – YNWA
Учитывая, что это операция умножения с накоплением, как близко Вы смотрели на _все_ вариантов 'vmla' ? – Notlikethat
Я так новичок в ARM asm, я даже не знал, с чего начать ... от дальнейшего поиска Я думаю, что VMLAL.U32 может выполнить эту работу ... однако я не уверен на 100%. кто-нибудь знает? – YNWA
Вот хороший список функций и инструкций, которые они представляют. VMLAL_U32() следует преобразовать в umlal. https://gcc.gnu.org/onlinedocs/gcc-4.3.2/gcc/ARM-NEON-Intrinsics.html – BitBank