Présentation
En anglaisRÉSUMÉ
Cet article présente les processeurs à très grand nombre de cœurs (manycores), avec les caractéristiques qui les distinguent des multicœurs et des GPU : type et performances des cœurs, décomposition hiérarchique en clusters de cœurs, modèle mémoire (partagée ou distribuée) et développements logiciels. Ils sont utilisés dans deux classes d’applications : le calcul scientifique haute performance pour lequel la performance est le critère clé, et les applications mobiles ou embarquées haute performance à faible consommation.
Quatre exemples sont détaillés : les Xeon Phi d’Intel, le SW26010 utilisé dans le superordinateur TaihuLight, les versions 16,64 et 1024 cœurs de l’architecture Epiphany d’Adapteva et lesmanycoresMMPA2 et MMPA3 de Kalray.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
This article introduces the manycore processors with the features that distinguish them from multi-cores and GPUs: type and performance of cores, hierarchical decomposition into clusters of cores, memory model (shared or distributed) and software developments. They are used in two classes of applications: high-performance computing for which performance is the key criterion, and high-performance low-power mobile or embedded applications.
Four examples are detailed: the Intel Xeon Phi, the SW26010 used in the TaihuLight supercomputer, the 16, 64 and 1024 core versions of the Adapteva Epiphany architecture and the Kalray MMPA2 and MMPA3 processors.
Auteur(s)
-
Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Sud
INTRODUCTION
Sans prendre en compte les processeurs graphiques (GPU) qui constituent à eux seuls une classe d’architecture, les processeurs à grand nombre de cœurs se distinguent des processeurs multicœurs, non seulement par le nombre de cœurs, mais également par un certain nombre de caractéristiques : le type et la performance des cœurs, la décomposition hiérarchique en clusters (ou nœuds) de cœurs, le modèle mémoire (mémoire partagée ou mémoire distribuée) et les problèmes logiciels liés au fait qu’ils sont presque toujours utilisés comme coprocesseurs. Ces manycores sont utilisés dans deux grandes classes d’applications : celles, comme le calcul scientifique, pour lesquelles la haute performance est le critère le plus important d’une part, et les applications mobiles et embarquées haute performance pour lesquelles les contraintes énergétiques sont fondamentales, d’autre part.
Les différentes caractéristiques sont présentées avec les différentes variantes. Puis quatre exemples de processeurs manycores sont détaillés. Les deux premiers sont destinés au calcul haute performance et dissipent deux à trois centaines de watts :
-
les processeurs et coprocesseurs Xeon Phi d’Intel avec les modèles Knights Corner et Knights Landing ;
-
le manycore SW26010 utilisé dans le superordinateur chinois TaihuLight qui a été de Juin 2016 à Novembre 2017 le premier au TOP500 des superordinateurs.
Les deux exemples suivants sont des architectures destinées aux applications mobiles et embarquées haute performance et dissipent de quelques watts à trois dizaines de watts :
-
les processeurs implantant l’architecture Epiphany d’Adapteva, avec deux versions utilisées à 16 ou 64 cœurs et une version 1 024 cœurs qui semble être un échec ;
-
l’architecture MPPA de Kalray, avec notamment l’étude des versions MMPA2 et MPPA3.
L’approche Xeon Phi, utilisant la mémoire partagée et des cœurs non suffisamment simplifiés par rapport à ceux des multicœurs, a des performances insuffisantes par rapport aux processeurs graphiques, ce qui a conduit en 2018 à son abandon par Intel. Les manycores SW26010 et Pezy SC-2 utilisent une hiérarchisation de cœurs et la mémoire partagée. Ils sont utilisés dans des superordinateurs ayant les meilleures performances au monde. Les processeurs manycores destinés aux applications embarquées haute performance sont prometteurs. Si Adaptera n’utilise que les versions Epiphany 16 et 64 cœurs, Kalray, avec l’architecture MPPA3 dont la puissance dissipée reste de l’ordre de 20 W et avec ses extensions arithmétiques pour la vision par ordinateur et l’apprentissage profond, semble bien positionné dans cette classe d’applications.
Les processeurs manycores ne sont pas la continuité des multicœurs avec un plus grand nombre de cœurs. Le nombre de cœurs est très loin d’une progression exponentielle. Les nouvelles applications de l’intelligence artificielle semblent favoriser les manycores à faible consommation et les aider à trouver leur créneau dans les choix entre multicœur, GPU et FPGA.
KEYWORDS
manycore | Xeon Phi | SW26010 | Epiphany | Kalray
VERSIONS
- Version courante de nov. 2023 par Daniel ETIEMBLE
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
6. Glossaire
AVX (Advanced Vector Extension)
Caractérise des extensions SIMD dans le jeu d'instructions Intel 64 : les instructions AVX travaillent sur des registres et des mots mémoire de 256 bits, et les instructions AVX-512 sur des registres et des mots mémoire de 512 bits.
MOESI
protocole de cohérence de caches utilisé dans les multi-cœurs
MESIF
protocole de cohérence de caches utilisé dans les multi--cœurs
SIMD (Single Instruction Multiple Data)
Instructions des processeurs effectuant la même opération sur plusieurs données consécutives contenues dans un registre ou une case mémoire
VPU (Vector Processing Unit)
Nom de l’unité de calcul SIMD dans les coprocesseurs Xeon Phi d’Intel
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Glossaire
BIBLIOGRAPHIE
-
(1) - ESP2. - - https://en.wikipedia.org/wiki/ESP32.
-
(2) - MATTSON (T.) - The future of Many Core Computing : A tale of two processors, - https://cseweb.ucsd.edu/classes/fa12/cse291-c/talks/SCC-80-core-cern.pdf
-
(3) - DONGARRA (J.) - Report on the Sunway TaihuLight System. - http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf
-
(4) - FU (H.), LI AO (J.), YANG (J.), WANG (L.), HUANG (X.), YANG (C.), XUE (W.)i, QIAO (F.), ZHAO (W.), YIN (X.), HOU (C.), GE (W.), ZHANG (J.), WANG (Y.), YANG (G.) - The Sunway TaihuLight supercomputer : system and applications - In SCIENCE CHINA, Information Sciences, 59, 072001(2016). doi:10.1007/s11432-016-5588-7
-
(5) - INTEL WHITE PAPER - Migrating Offloading Software to Intel® Xeon Phi™ Processor, - February 2018. https://www.intel.com/content/dam/www/public/us/en/documents/white-papers/migrating-offloading-software-paper.pdf
-
...
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Adapteva : http://www.adapteva.com/
Caffe : http://caffe.berkeleyvision.org/
Intel Xeon Phi : https://www.intel.fr/content/www/fr/fr/products/processors/xeon-phi/xeon-phi-processors.html
Kalray : https://www.kalrayinc.com
OpenVx : https://www.khronos.org/openvx/
SYCL, https://www.khronos.org/sycl/
TensorFlow : https://www.tensorflow.org/
Tilera : https://en.wikipedia.org/wiki/Tilera
HAUT DE PAGECet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive