Présentation
EnglishRÉSUMÉ
Cet article présente les processeurs à très grand nombre de cœurs (manycores), avec les caractéristiques qui les distinguent des multicœurs et des GPU : type et performances des cœurs, décomposition hiérarchique en clusters de cœurs, modèle mémoire (partagée ou distribuée) et développements logiciels. Ils sont utilisés dans deux classes d’applications : le calcul scientifique haute performance pour lequel la performance est le critère clé, et les applications mobiles ou embarquées haute performance à faible consommation.
Quatre exemples sont détaillés : les Xeon Phi d’Intel, le SW26010 utilisé dans le superordinateur TaihuLight, les versions 16,64 et 1024 cœurs de l’architecture Epiphany d’Adapteva et lesmanycoresMMPA2 et MMPA3 de Kalray.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Sud
INTRODUCTION
Sans prendre en compte les processeurs graphiques (GPU) qui constituent à eux seuls une classe d’architecture, les processeurs à grand nombre de cœurs se distinguent des processeurs multicœurs, non seulement par le nombre de cœurs, mais également par un certain nombre de caractéristiques : le type et la performance des cœurs, la décomposition hiérarchique en clusters (ou nœuds) de cœurs, le modèle mémoire (mémoire partagée ou mémoire distribuée) et les problèmes logiciels liés au fait qu’ils sont presque toujours utilisés comme coprocesseurs. Ces manycores sont utilisés dans deux grandes classes d’applications : celles, comme le calcul scientifique, pour lesquelles la haute performance est le critère le plus important d’une part, et les applications mobiles et embarquées haute performance pour lesquelles les contraintes énergétiques sont fondamentales, d’autre part.
Les différentes caractéristiques sont présentées avec les différentes variantes. Puis quatre exemples de processeurs manycores sont détaillés. Les deux premiers sont destinés au calcul haute performance et dissipent deux à trois centaines de watts :
-
les processeurs et coprocesseurs Xeon Phi d’Intel avec les modèles Knights Corner et Knights Landing ;
-
le manycore SW26010 utilisé dans le superordinateur chinois TaihuLight qui a été de Juin 2016 à Novembre 2017 le premier au TOP500 des superordinateurs.
Les deux exemples suivants sont des architectures destinées aux applications mobiles et embarquées haute performance et dissipent de quelques watts à trois dizaines de watts :
-
les processeurs implantant l’architecture Epiphany d’Adapteva, avec deux versions utilisées à 16 ou 64 cœurs et une version 1 024 cœurs qui semble être un échec ;
-
l’architecture MPPA de Kalray, avec notamment l’étude des versions MMPA2 et MPPA3.
L’approche Xeon Phi, utilisant la mémoire partagée et des cœurs non suffisamment simplifiés par rapport à ceux des multicœurs, a des performances insuffisantes par rapport aux processeurs graphiques, ce qui a conduit en 2018 à son abandon par Intel. Les manycores SW26010 et Pezy SC-2 utilisent une hiérarchisation de cœurs et la mémoire partagée. Ils sont utilisés dans des superordinateurs ayant les meilleures performances au monde. Les processeurs manycores destinés aux applications embarquées haute performance sont prometteurs. Si Adaptera n’utilise que les versions Epiphany 16 et 64 cœurs, Kalray, avec l’architecture MPPA3 dont la puissance dissipée reste de l’ordre de 20 W et avec ses extensions arithmétiques pour la vision par ordinateur et l’apprentissage profond, semble bien positionné dans cette classe d’applications.
Les processeurs manycores ne sont pas la continuité des multicœurs avec un plus grand nombre de cœurs. Le nombre de cœurs est très loin d’une progression exponentielle. Les nouvelles applications de l’intelligence artificielle semblent favoriser les manycores à faible consommation et les aider à trouver leur créneau dans les choix entre multicœur, GPU et FPGA.
VERSIONS
- Version courante de nov. 2023 par Daniel ETIEMBLE
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Exemples de manycores
Dans cette partie, nous présentons la synthèse des choix architecturaux effectués dans les quatre architectures que nous avons considérées. Seuls les aspects matériels sont considérés. Une évaluation détaillée des performances sort également du cadre de cet article.
4.1 Architectures Xeon phi
L’approche Intel dans le domaine des manycores est connue sous le nom MIC (many-integrated-core) et a connu deux générations de Xeon Phi dont les noms de code ont été successivement KNC (Knights Corner) et KNL (Knights Landing). Ce sont des coprocesseurs avec une version processeur indépendant pour KNL.
Le coprocesseur Xeon Phi d’Intel correspond à l’approche visant à étendre au domaine manycore les caractéristiques des multicœurs, avec notamment :
-
compatibilité logicielle avec la gamme Intel (jeu d’instructions x86) ;
-
hiérarchie mémoire avec cohérence de caches : mémoire logiquement partagée ;
-
mémoire virtuelle avec traduction des pages et TLB ;
-
réseaux d’interconnexion de type anneau ou grille 2D comme dans les multicœurs.
La génération KNC est devenue disponible en 2012. L’architecture générale est présentée en figure 2. Jusqu’à 61 cœurs peuvent être connectés à un anneau bidirectionnel. Chaque cœur est un superscalaire statique d’ordre 2 dérivé de l’architecture Pentium P54C, avec multithreading simultané de 4 threads. Il possède une unité SIMD appelée Vector Processing Unit avec des vecteurs de 512 bits et pouvant donc exécuter 16 opérations en simple précision ou 8 opérations en double précision par cycle. 8 Go de mémoire GDDR5 sont également connectés au bus. L’anneau est connecté au processeur hôte par une liaison PCIe.
L’architecture KNL ...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Exemples de manycores
BIBLIOGRAPHIE
-
(1) - ESP2. - - https://en.wikipedia.org/wiki/ESP32.
-
(2) - MATTSON (T.) - The future of Many Core Computing : A tale of two processors, - https://cseweb.ucsd.edu/classes/fa12/cse291-c/talks/SCC-80-core-cern.pdf
-
(3) - DONGARRA (J.) - Report on the Sunway TaihuLight System. - http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf
-
(4) - FU (H.), LI AO (J.), YANG (J.), WANG (L.), HUANG (X.), YANG (C.), XUE (W.)i, QIAO (F.), ZHAO (W.), YIN (X.), HOU (C.), GE (W.), ZHANG (J.), WANG (Y.), YANG (G.) - The Sunway TaihuLight supercomputer : system and applications - In SCIENCE CHINA, Information Sciences, 59, 072001(2016). doi:10.1007/s11432-016-5588-7
-
(5) - INTEL WHITE PAPER - Migrating Offloading Software to Intel® Xeon Phi™ Processor, - February 2018. https://www.intel.com/content/dam/www/public/us/en/documents/white-papers/migrating-offloading-software-paper.pdf
-
...
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Adapteva : http://www.adapteva.com/
Caffe : http://caffe.berkeleyvision.org/
Intel Xeon Phi : https://www.intel.fr/content/www/fr/fr/products/processors/xeon-phi/xeon-phi-processors.html
Kalray : https://www.kalrayinc.com
OpenVx : https://www.khronos.org/openvx/
SYCL, https://www.khronos.org/sycl/
TensorFlow : https://www.tensorflow.org/
Tilera : https://en.wikipedia.org/wiki/Tilera
HAUT DE PAGECet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive