Я сделал некоторое встроенное кодирование ASM для SSE раньше, и это тоже не сложно даже для тех, кто не знает ASM. Но я отмечаю, что MS также обеспечивает внутреннюю поддержку многих таких специальных инструкций.Intrinsics Vs inline ASM для кодирования SSE в VC++ 2K8
Есть ли конкретная разница в производительности или любая другая сильная причина, по которой следует использовать над другим?
Чтобы повторить из заголовка, это особенно касается внутренних функций, открытых VC++ 2008 для неуправляемого, родного языка C++.
Аргумент производительности - правильный аргумент для внутренних функций. Для большинства задач полученный код будет достаточно хорош, чтобы повысить производительность от использования встроенных функций намного ценнее, чем добавленная производительность при использовании сборки.Действительно, в сборке должны быть записаны только библиотеки и небольшие разделы, которые абсолютно критичны по производительности. –