simd

    10зной

    3ответ

    в gcc, я хочу сделать 128 бит xor с 2 переменными C, через код asm: как? asm ( "movdqa %1, %%xmm1;" "movdqa %0, %%xmm0;" "pxor %%xmm1,%%xmm0;" "movdqa %%xmm0, %0;" :"=x"(buff)

    8зной

    2ответ

    Я хотел бы начать и играть с некоторыми инструкциями по расширению AVX (расширенное векторное расширение). Я знаю, что Intel предоставляет эмулятор для тестирования программного обеспечения, содержаще

    11зной

    6ответ

    Мне нужно некоторое представление о том, как написать кроссплатформенную реализацию C++ для нескольких параллелизуемых проблем, чтобы я мог использовать SIMD (SSE, SPU и т. Д.), Если таковые имеются.

    6зной

    4ответ

    Учитывая регистр 4 байта (или 16 для SIMD), должен быть эффективный способ сортировки байтов в регистре с несколькими инструкциями. Заранее спасибо.

    17зной

    2ответ

    Где я могу найти информацию об общих трюках SIMD? У меня есть набор инструкций и знаю, как писать нехитрый код SIMD, но я знаю, что теперь SIMD намного мощнее. Он может содержать сложный условный беск

    15зной

    6ответ

    Theres - это пара мест в моей базе кода, где одна и та же операция повторяется очень много раз для большого набора данных. В некоторых случаях для их обработки требуется значительное время. Я считаю,

    1зной

    1ответ

    Heya, я пытаюсь использовать SIMD Mono для обработки координат (X, Y, Z) в моем проекте, , но я вижу только поддержку типов Vector2 и Vector4. Кто-нибудь сталкивался с этим раньше, и есть ли какие-ниб

    2зной

    1ответ

    Скажем, я использую хэш для идентификации файлов, поэтому мне не нужно, чтобы это было безопасно, мне просто нужно свести к минимуму столкновения. Я думал, что могу ускорить хеш, выполнив четыре хэша

    4зной

    2ответ

    Каков наилучший способ (sse2) уменьшить _m128 (4 слова a b c d) до одного слова? Я хочу низкую часть каждого _m128 компонентов: int result = (_m128.a & 0x000000ff) << 24 | (_m128.b & 0x000000ff)