Instruction unique, données multiples (SIMD) est le concept de faire fonctionner chaque instruction sur un petit morceau ou vecteur d'éléments de données. Les jeux d'instructions vectorielles CPU comprennent: x86 SSE et AVX, ARM NEON et PowerPC AltiVec. Pour utiliser efficacement les instructions SIMD, les données doivent être sous forme de structure de tableaux et doivent apparaître dans des flux plus longs. Le code naïvement «optimisé SIMD» surprend souvent en s'exécutant plus lentement que l'original.
Je optimise un certain code pour une micro-architecture Intel X86 Nehalem utilisant SSE intrinsique. Une partie de mon programme calcule 4 produits DOT et ajoute chaque résultat aux val ...
Je travaille avec des fonctions intrinsèques SSE. J'ai un __M128I représentant un tableau de 8 valeurs courtes (16 bits) signées. existe une fonction pour obtenir le signe ...
J'utilise l'extension de vecteur Simd GCC pour un projet, tout fonctionne assez bien mais jette simplement, ils réinitialisent simplement tous les composants d'un vecteur. the ...