Présentation
RÉSUMÉ
Cet article présente les processeurs à très grand nombre de cœurs (manycores), avec les caractéristiques qui les distinguent des multicœurs et des GPU : type et performances des cœurs, décomposition hiérarchique en clusters de cœurs, modèle mémoire (partagée ou distribuée) et développements logiciels. Ils sont utilisés dans trois classes d’applications : les applications mobiles ou embarquées haute performance à faible consommation, le calcul scientifique haute performance et les accélérateurs pour réseaux de neurones profonds
Six exemples sont détaillés : les Xeon Phi d’Intel, le SW26010 utilisé dans le superordinateur TaihuLight, les versions 16, 64 et 1024 cœurs de l’architecture Epiphany d’Adapteva, lesmanycoresMMPA2 et MMPA3 de Kalray, l’accélérateur Boqueria d’Untether et le circuit WSE-2 de Celebras
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Sud
INTRODUCTION
Sans prendre en compte les processeurs graphiques (GPU) qui constituent à eux-seuls une classe d’architecture, les processeurs à grand nombre de cœurs se distinguent des processeurs multicœurs, non seulement par le nombre de cœurs, mais également par un certain nombre de caractéristiques : le type et la performance des cœurs, la décomposition hiérarchique en clusters (ou nœuds) de cœurs, le modèle mémoire (mémoire partagée ou mémoire distribuée) et les problèmes logiciels liés au fait qu’ils sont presque toujours utilisés comme coprocesseurs. Ces manycores sont utilisés dans trois grandes classes d’applications :
-
les applications mobiles et embarquées haute performance pour lesquelles les contraintes énergétiques sont fondamentales ;
-
les applications pour lesquelles la haute performance est le critère le plus important, comme le calcul scientifique ;
-
les circuits spécialisés pour l’apprentissage et l’inférence dans les réseaux de neurones profonds. Cette classe d’applications est celle qui voit apparaître le plus grand nombre de circuits.
Les différentes caractéristiques sont présentées avec les différentes variantes. Puis six exemples de processeurs manycores sont détaillés.
Les deux premiers sont des architectures destinées aux applications mobiles et embarquées haute performance et dissipent de quelques watts à trois dizaines de watts :
-
les processeurs implantant l’architecture Epiphany d’Adapteva, avec deux versions utilisées à 16 ou 64 cœurs et une version 1024 cœurs qui a été un échec ;
-
l’architecture MPPA de Kalray, avec notamment l’étude des versions MMPA2 et MPPA3.
Les deux exemples suivant sont destinés au calcul haute performance et dissipent deux à trois centaines de watts :
-
les processeurs et coprocesseurs Xeon Phi d’Intel avec les modèles Knights Corner et Knights Landing. Leur production a été abandonnée en 2018 ;
-
le manycore SW26010 utilisé dans le superordinateur chinois TaihuLight qui a été de juin 2016 à novembre 2017 le premier au TOP500 des superordinateurs.
Les deux derniers exemples correspondent à l’accélération de l’apprentissage et de l’inférence dans les réseaux de neurones :
-
l’accélérateur Boqueria AI de Untether est constitué d’une grille 2D de blocs mémoire, eux-même constitués d’une grille 2D de blocs avec un processeur élémentaire et une mémoire SRAM ;
-
le circuit WSE-2 de Celebras interconnecte une grille 2D de cœurs au niveau du wafer. Chaque cœur contient une partie calcul et une SRAM. Avec 850 000 cœurs et 15 kW de puissance dissipée, c’est le plus gros circuit en 2022.
Les processeurs manycores ne sont pas la continuité des multicœurs avec un plus grand nombre de cœurs. Le nombre de cœurs est très loin d’une progression exponentielle. Alors que les multicœurs utilisent le modèle mémoire partagée avec une hiérarchie de caches, les manycores utilisent le modèle mémoire distribuée, avec des blocs mémoire près du calcul. L’utilisation pour les réseaux de neurones de formats de donnée réduits (flottants 16 bits et 8 bits) permet d’augmenter le nombre de cœurs à consommation et surface de puce données par rapport aux circuits avec flottants double précision.
VERSIONS
- Version archivée 1 de mai 2019 par Daniel ETIEMBLE
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Des processeurs multicœurs aux manycores
Les processeurs multicœurs sont étudiés en détail dans l’article [H 1 090]. Depuis le premier bicœur en 2001 (Power4 d’IBM), ils se sont imposés comme la seule solution permettant de continuer à améliorer les performances tout en conservant une dissipation énergétique compatible avec les techniques classiques utilisées pour la mise en boîtier et le refroidissement. En 2023, la plupart des processeurs d’usage général (PC et serveurs) ou des systèmes mobiles (smartphones) sont des multicœurs. Seuls les systèmes à très faible consommation ou faibles performances utilisent encore des monoprocesseurs.
Les principaux fournisseurs de multicœurs sont Intel et AMD, IBM, ARM et Oracle (Sparc). Les cœurs utilisés sont des processeurs superscalaires performants (exécution non ordonnée). Le nombre maximal de cœurs physiques disponibles fin 2022 est respectivement 64 (AMD) et 40 (Intel) pour les serveurs haut de gamme. Pour les PC, la gamme Raptor Lake d’Intel utilise deux types de cœurs : des cœurs performants (P-core) avec 2 threads optimisés pour la performance et des cœurs efficaces (E-Core) monothread moins performants et consommant moins. Les processeurs Core i9 les plus performants utilisent 24 cœurs (8 P + 16 E). Pour AMD, les Ryzen 9 les plus performants ont 16 cœurs physiques. À l’exception des E-Core d’Intel, les cœurs ont 2 threads.
Un certain nombre de processeurs manycores ont été réalisés et évalués, en plusieurs étapes, avec des caractéristiques différentes. De manière non exhaustive, on peut citer :
TEST DE VALIDATION ET CERTIFICATION CerT.I. :
Cet article vous permet de préparer une certification CerT.I.
Le test de validation des connaissances pour obtenir cette certification de Techniques de l’Ingénieur est disponible dans le module CerT.I.
de Techniques de l’Ingénieur ! Acheter le module
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Des processeurs multicœurs aux manycores
BIBLIOGRAPHIE
-
(1) - MATTSON (T.) - The future of Many Core Computing: A tale of two processors, - https://cseweb.ucsd.edu/classes/fa12/cse291-c/talks/SCC-80-core-cern.pdf
-
(2) - DONGARRA (J.) - Report on the Sunway TaihuLigtht System. - http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf
-
(3) - FU (H.), LI AO (J.), YANG (J.), WANG (L.), HUANG (X.), YANG (C.), XUE (W.), QIAO (F.), ZHAO (W.), YIN (X.), HOU (C.), GE (W.), ZHANG (J.), WANG (Y.), YANG (G.) - The Sunway TaihuLight supercomputer: system and applications, - In SCIENCE CHINA, Information Sciences, 59, 072001 (2016); doi : 10.1007/s11432-016-5588-7.
-
(4) - ADAPTEVA - Epiphany Architecture Reference, - Rev 14.03.11, 2014. Available: http://adapteva.com/docs/epiphany_arch_ref.pdf, [Nov. 25, 2014].
-
(5) - OLOFSSON (A.), NORDSTROM (T.), UL-ABDIN (UL-ABDIN) (Z.) - Kickstarting High-performance Energy-efficient Manycore Architectures with Epiphany, - Proceedings Asilomar Conference on Signal, Systems and Computers, pp 1719-1726 (2014).
- ...
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Adapteva : http://www.adapteva.com/
Caffe: http://caffe.berkeleyvision.org/
Intel Xeon Phi : https://www.intel.fr/content/www/fr/fr/products/processors/xeon-phi/xeon-phi-processors.html
Kalray : https://www.kalrayinc.com/
OpenVx : https://www.khronos.org/openvx/
SYCL, https://www.khronos.org/sycl/
TensorFlow: https://www.tensorflow.org/
Tilera : https://en.wikipedia.org/wiki/Tilera
HAUT DE PAGECet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE
1/ Quiz d'entraînement
Entraînez vous autant que vous le voulez avec les quiz d'entraînement.
2/ Test de validation
Lorsque vous êtes prêt, vous passez le test de validation. Vous avez deux passages possibles dans un laps de temps de 30 jours.
Entre les deux essais, vous pouvez consulter l’article et réutiliser les quiz d'entraînement pour progresser. L’attestation vous est délivrée pour un score minimum de 70 %.
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive