Présentation
EnglishRÉSUMÉ
Cet article décrit les extensions SIMD des jeux d'instructions des microprocesseurs. Les différentes extensions SSE et AVX de IA-32 et Intel64 (Intel), les extensions Neon d'ARM et les différentes variantes d'IBM (Altivec) sont prises comme exemple. L'article montre les spécificités de l'arithmétique entière, du traitement des structures conditionnelles, des accès mémoire. Il montre comment les extensions comprennent des extensions naturelles des instructions scalaires, et des instructions ad hoc destinées à des applications particulières. Ces instructions s'utilisent soit en aidant le compilateur à «vectoriser», soit en utilisant des intrinsèques, qui sont des appels de fonctions correspondant aux instructions à insérer dans un programme C ou C++.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Daniel ETIEMBLE : Ingénieur INSA Lyon - Professeur émérite à l'université Paris Sud
-
Lionel LACASSAGNE : Ingénieur EPITA - Maître de conférences à l'université Paris Sud
INTRODUCTION
Cet article décrit les caractéristiques principales des extensions SIMD des jeux d'instructions des microprocesseurs modernes qui ont été introduites et développées depuis les années 1990. Les opérations arithmétiques et logiques effectuées par les instructions scalaires des jeux d'instructions s'effectuent sur la taille maximale des registres des processeurs, 32 ou 64 bits. Or, les programmes peuvent travailler sur des données de taille inférieure, comme les octets (8 bits), les mots de 16 bits, ces données étant signées ou non signées. C'est le cas notamment pour le traitement d'images, le traitement du signal et de nombreuses autres applications. Le principe des instructions SIMD est donc d'utiliser des registres de plus grande taille (128, 256 ou 512 bits) et d'effectuer la même opération sur des vecteurs contenant plusieurs éléments 8 bits, 16 ou 32 bits pour les nombres entiers, 32 ou 64 bits sur les nombres en représentation flottante.
Les caractéristiques de ces extensions sont illustrées à partir des plus utilisées : SSE à SSE4.2, AVX et AVX2 pour les jeux d'instructions IA-32 et Intel 64 d'Intel, Neon et Neon2 d'ARM, Altivec et ses différentes variantes IBM.
Les instructions arithmétiques flottantes ne posent aucun problème. Le problème des retenues pour les instructions arithmétiques entières est détaillé. Les instructions SIMD effectuant la même opération sur tous les éléments d'un vecteur, les structures conditionnelles if-then-else impliquent un traitement particulier. Les instructions mémoire doivent accéder à des éléments situés à des adresses mémoire successives, ce qui implique des traitements particuliers lorsque ce n'est pas le cas. L'exemple classique est le cas de données rangées en mémoire sous forme de tableaux de structures (AoS) qu'il faut transformer en structures de tableaux (SoA) pour permettre des calculs SIMD.
La plupart des instructions SIMD sont des extensions naturelles des instructions scalaires des jeux d'instructions accompagnées des instructions de manipulation de données pour faciliter le traitement SIMD. Ces instructions s'accompagnent d'instructions ad hoc destinées à des applications particulières. Les extensions SIMD ont aussi été appelées extensions multimédias, car elles avaient initialement pour objectif de rendre compétitifs les processeurs généralistes sur les applications multimédias, les applications du traitement de signal et de sécurité. Des exemples typiques d'instructions ad hoc visent la détection de mouvement, le calcul sur les nombres complexes, la cryptographie, etc.
Cet article détaille également comment utiliser ces instructions. Une possibilité est d'aider le compilateur à « vectoriser », c"est-à-dire à les utiliser. L'autre approche consiste à utiliser des intrinsèques à insérer dans un code C ou C++ : ce sont des appels de fonctions aux instructions SIMD à utiliser notamment pour l'arithmétique entière ou lorsque des transformations de haut niveau qui ne sont pas à la portée du compilateur sont nécessaires.
Les extensions 512 bits récentes lèvent certaines limites des extensions SIMD en permettant un traitement partiel des éléments des vecteurs selon un masque et en permettant des accès mémoire à des adresses non consécutives. Ces évolutions rapprochent les extensions SIMD des caractéristiques des processeurs vectoriels des années 1980.
MOTS-CLÉS
instructions SIMD SSE AVX Neon Alvitec vectorisation intrinsèque
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Utilisation des instructions SIMD
Comme pour toutes les instructions d'un processeur, les instructions SIMD peuvent être utilisées au niveau de la programmation assembleur, mais cette méthode est complexe ou peu efficace. Les deux méthodes utilisées sont donc les options de « vectorisation » des compilateurs et l'appel à des fonctions proches des instructions assembleur, dites intrinsèques (intrinsics ) .
3.1 Compilateurs
3.1.1 Options des compilateurs
Tous les compilateurs, par exemple gcc, icc d'Intel et les compilateurs d'IBM possèdent des options permettant d'activer l'utilisation des instructions SIMD, ces options précisant éventuellement le type d'extensions utilisable dans le processeur utilisé. Pour les processeurs Intel, c'est par exemple les niveaux d'extension SSE et AVX disponibles.
HAUT DE PAGE3.1.2 Conditions de vectorisation
Le programmeur écrivant un programme dans un langage de haut niveau comme C ou C++ doit prendre en compte les caractéristiques des instructions SIMD, et connaître les caractéristiques d'un programme qui empêcheront le compilateur d'utiliser les instructions SIMD. Il y a trois grandes caractéristiques qui doivent être respectées.
-
Accès mémoire à pas unitaire
Comme déjà indiqué, les instructions mémoire de type load et store ne peuvent charger dans un registre SIMD ou ranger en mémoire à partir d'un registre SIMD que des mots mémoire d'adresses successives, quelle que soit la taille de ces mots mémoire (8, 16, 32 ou 64 bits). Cela implique d'éviter dans la mesure du possible les algorithmes conduisant à des accès mémoire...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Utilisation des instructions SIMD
BIBLIOGRAPHIE
-
(1) - INTEL - Intel® 64 and IA-32 architectures software developer manuals. - http://www.intel.com/content/www/us/en/ processors/architectures-software- developer-manuals.html (page consultée le 4 décembre 2014).
-
(2) - ALTIVEC - AltiVec technology programming interface manual. - (1999). http://www.freescale.com/files/32bit/doc/ ref_manual/ALTIVECPIM.pdf (page consultée le 4 décembre 2014).
-
(3) - ARM Infocenter - The architecture of digital world. - http://www.infocenter.arm.com/help/ index.jsp (page consultée le 4 décembre 2014).
-
(4) - KUAH (K.) - Motion estimation with Intel® streaming SIMD extensions 4 (Intel® SSE4). - Intel software solutions group (2008). https://www.software.intel.com/en-us/ articles/motion-estimation-with-intel- streaming-simd-extensions-4-intel-sse4 (page consultée le 4 décembre 2014).
-
(5) - SIEWERT (S.) - Using Intel® streaming SIMD extensions and intel® integrated performance primitives to accelerate algorithms. - Inter developer zone (2009). https://www.software.intel.com/en-us/...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive