1.1 - Besoins des applications

Tableau 1 Tableau 2
1.2 - Mur de la chaleur

2.1 - Approche intuitive du parallélisme
2.2 - Définition formelle

3 - SOURCES DU PARALLÉLISME ET OPÉRATIONS FONDAMENTALES

3.1 - Parallélisme de données
3.2 - Parallélisme de contrôle
3.3 - Opérations fondamentales du parallélisme
3.4 - Consistance mémoire

Tableau 3

4 - PARALLÉLISME DANS LES MONOPROCESSEURS

5 - CLASSIFICATION DES ARCHITECTURES PARALLÈLES

5.1 - Classification de Flynn

Tableau 4
5.2 - Classification selon le modèle mémoire

Figure 12 - Organisation CC-NUMA
5.3 - Classification suivant le grain de calcul

Tableau 5 Tableau 6
5.4 - Architectures parallèles homogènes ou hétérogènes
5.5 - Organisation du système d’exploitation dans les architectures parallèles

6 - RESSOURCES DES ARCHITECTURES PARALLÈLES

7 - MODÈLES D’EXÉCUTION

8 - PROGRAMMATION DES ARCHITECTURES PARALLÈLES

8.1 - Extensions parallèles des langages séquentiels
8.2 - Modèles de programmation

Tableau 8

9 - LOIS ET MÉTRIQUES DE PERFORMANCES DES ARCHITECTURES PARALLÈLES

9.1 - Performances
9.2 - Lois de performance
9.3 - Modèle « Roofline »

Figure 22 - Le modèle Roofline
9.4 - Métriques et benchmarks

10 - REMARQUES POUR CONCLURE

11 - GLOSSAIRE

Bibliographie & annexes

Article de référence | Réf : H1088 v2

Parallélisme dans les monoprocesseurs
Introduction au parallélisme et aux architectures parallèles

Auteur(s) : Franck CAPPELLO, Daniel ETIEMBLE

Date de publication : 10 août 2017 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

NOTE DE L'ÉDITEUR

Cet article est la version actualisée de l’article [H 1 088] intitulé Introduction au parallélisme et aux architectures parallèles, de Franck CAPPELLO et Jean-Paul SANSONNET, paru dans nos éditions en 1999.

05/08/2017

RÉSUMÉ

Le parallélisme est dorénavant utilisé dans la majorité des architectures, des systèmes embarqués aux superordinateurs. Les monoprocesseurs sont remplacés par des processeurs multicœurs. Cet article décrit la notion de parallélisme et ses différents types. Il présente les grandes classes d’architectures parallèles avec leurs ressources et organisations mémoire, en distinguant les architectures homogènes et hétérogènes. Les principes des techniques de programmation sont introduits avec les extensions parallèles des langages de programmation couramment utilisés et les modèles de programmation visant à rapprocher la programmation parallèle de la programmation séquentielle, en incluant les spécificités des architectures. Enfin, les modèles et métriques d’évaluation des performances sont examinés.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Franck CAPPELLO : Docteur en Informatique de l’université Paris Sud - IEEE Fellow
Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Sud - Note de l'éditeur : Cet article est la version actualisée de l'article [H 1 088] intitulé Introduction au parallélisme et aux architectures parallèles, de Franck CAPPELLO et Jean-Paul SANSONNET, paru dans nos éditions en 1999.

INTRODUCTION

La notion de parallélisme, qui consiste à utiliser plusieurs processeurs ou opérateurs matériels pour exécuter un ou plusieurs programmes, est ancienne. Les multiprocesseurs datent des années 1960. De cette période jusqu’à la fin des années 1990, des architectures parallèles ont été utilisées pour les applications nécessitant des besoins de calcul que les monoprocesseurs étaient incapables de fournir. Étaient concernés les mainframes et serveurs d’une part, et les machines vectorielles puis parallèles utilisées pour le calcul scientifique hautes performances d’autre part. Les années 1980 ont vu l’apparition de différentes sociétés proposant des machines parallèles, sociétés qui ont assez rapidement disparu. La raison essentielle est liée aux progressions exponentielles des performances des microprocesseurs, utilisés dans les PC et les serveurs multiprocesseurs. L’utilisation massive du parallélisme se limitait aux très grandes applications de simulation numérique avec les architectures massivement parallèles. Le début des années 2000, avec les limitations des monoprocesseurs et le « mur de la chaleur », a complètement changé la situation (voir [H 1 058]). Les processeurs multicœurs sont présents en 2016 dans les architectures matérielles pour tous les types de composants : appareils mobiles (smartphones, tablettes), systèmes embarqués, télévisions, PC portables et PC de bureau, et jusqu’aux machines parallèles et superordinateurs pour la très haute performance.

Dans cet article, nous introduisons la notion de parallélisme, présentons les différents types de parallélisme et les différentes formes d’architectures parallèles. Alors que la programmation des machines parallèles a été longtemps réservée à des spécialistes, tout programmeur doit maintenant maîtriser les notions essentielles de la programmation parallèle pour tirer parti des possibilités des architectures. Nous présentons les extensions parallèles des langages de programmation couramment utilisés, les modèles de programmation développés qui visent à « rapprocher » la programmation parallèle des techniques de la programmation séquentielle tout en prenant en compte les spécificités des architectures parallèles. Enfin, l’intérêt des architectures parallèles réside dans les performances qu’elles permettent d’atteindre. Pour optimiser ces performances et/ou réduire la consommation énergétique, il est nécessaire de modéliser d’une part le parallélisme existant dans une application et d’autre part les architectures parallèles. Nous examinons donc les métriques utilisées pour évaluer ou prévoir les performances et les grandes lois qui les gouvernent.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

MOTS-CLÉS

parallélisme de données et de contrôle extensions SIMD classification de Flynn mémoires partagées et distribuées modèles d'exécution modèles de programmation OpenMP MPI pThreads loi d’Amdhal modèle Roofline

VERSIONS

Il existe d'autres versions de cet article :

Version archivée 1 de août 1999 par Franck CAPPELLO, Jean-Paul SANSONNET

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h1088

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

Accueil > Ressources documentaires > Sciences fondamentales > Mathématiques > Méthodes numériques > Introduction au parallélisme et aux architectures parallèles > Parallélisme dans les monoprocesseurs

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(236 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Classification des architectures parallèles

4. Parallélisme dans les monoprocesseurs

Les monoprocesseurs utilisent un parallélisme compatible avec une programmation séquentielle, c’est-à-dire que le flux d’exécution des instructions est strictement séquentiel. Ce parallélisme est appelé « parallélisme d’instructions » car il correspond aux instructions du programme séquentiel qui peuvent s’exécuter en parallèle, sans dépendances de données, de contrôle ou de ressources.

Le temps d’exécution d’un programme est donné par l’équation suivante :

T_{e x} = N I * C P I * T_{c} = \frac{N I}{I P C * F}

où :

NI est le nombre d’instructions à exécuter ;
CPI est le nombre de cycles d’horloge par instruction. Il comprend les cycles d’exécution des instructions et les cycles supplémentaires d’attente des données mémoire ;
IPC le nombre d’instructions exécutées par cycle ;
T_c est le temps de cycle d’horloge et F la fréquence d’horloge.

L’augmentation de la fréquence d’horloge F que permettent les nœuds technologiques CMOS successifs a longtemps été le moyen le plus simple d’augmenter les performances. Avec le « mur de la chaleur », les fréquences d’horloge des processeurs dépassent rarement 4 GHz.

Au terme IPC correspond le parallélisme d’instructions. Il correspond à l’utilisation des pipelines (voir [H 1 004]), à l’exécution superscalaire des instructions dans l’ordre ...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(236 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Parallélisme dans les monoprocesseurs

Page
précédenteSources du parallélisme et opérations fondamentales

Page
suivante

Classification des architectures parallèles

BIBLIOGRAPHIE

(1) - KOBAYASHI (H.) - Feasibility Study of a Future HPC System for Memory-Intensive Applications : Final Report. - Proceedings of the joint Workshop on Sustained Simulation Performance, University of Stuttgart (HLRS) and Tohoku University, pp 3-16 (2014).
(2) - KOBAYASHI (H.) - Feasibility Study of a Future HPC System for Memory-Intensive Applications : Final Report. - in SuperComputing, NEC Booth, http://jpn.nec.com/hpc/info/pdf/SC13_NEC_Tohoku_Prof.Kobayashi.pdf (2013).
(3) - BERNSTEIN (A.J.) - Analysis of Programs for Parallel Processing. - IEEE Transactions on Electronic Computers. EC-15 (5) : 757-763 (October 1966).
(4) - * - Intel® 64 and IA-32 Architectures Software Developer Manuals, http://www.intel.com/content/www/us/en/processors/architectures-software-developer-manuals.html.
(5) - * - ARM Synchronization Primitives, http://infocenter.arm.com/help/topic/com.arm.doc.dht0008a/DHT0008A_arm_synchronization_primitives.pdf.
...

DANS NOS BASES DOCUMENTAIRES

ANNEXES

1 Sites Internet

1 Sites Internet

Intel

http://ark.intel.com/fr

ARM

http://www.arm.com/products/processors/

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(236 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Parallélisme dans les monoprocesseurs Introduction au parallélisme et aux architectures parallèles

NOTE DE L'ÉDITEUR

RÉSUMÉ

Auteur(s)

INTRODUCTION

Cet article est réservé aux abonnés.Il vous reste 93% à découvrir.

L'expertise technique et scientifique de référence

MOTS-CLÉS

VERSIONS

DOI (Digital Object Identifier)

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

4. Parallélisme dans les monoprocesseurs

Cet article est réservé aux abonnés.Il vous reste 93% à découvrir.

L'expertise technique et scientifique de référence

BIBLIOGRAPHIE

DANS NOS BASES DOCUMENTAIRES

ANNEXES

Cet article est réservé aux abonnés.Il vous reste 95% à découvrir.

L'expertise technique et scientifique de référence

Parallélisme dans les monoprocesseurs
Introduction au parallélisme et aux architectures parallèles

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.