SSE 4.2 выполняет сравнение на двух операндах 16 байт за раз. Но также можно сравнить два операнда 8 байтов за один раз с обычными инструкциями процессора.Имеет ли смысл иметь SSE 4.2 на 64-битном процессоре?
Разница не такая большая, чтобы иметь специальную твердую реализацию такого сравнения. Является ли SSE 4.2 такой неуместной, или я что-то пропустил?
Вы действительно измерили разницу в производительности?Или это все предположения? – hirschhornsalz