Présentation
RÉSUMÉ
Cet article présente l’évolution de l’architecture des ordinateurs, précisant ainsi la place et le rôle des articles de la rubrique «Matériel» de ce traité. Il décrit l’articulation entre la technologie des semi-conducteurs, les concepts architecturaux et les besoins des grandes classes d’applications utilisant ces ordinateurs, qu’ils soient visibles (PC et serveurs) ou non (systèmes embarqués et systèmes mobiles). L’augmentation des fréquences d’horloge liée aux générations successives de technologies CMOS a été déterminante pour les performances jusqu'au début des années 2000, mais le «mur de la chaleur», qui interdit des fréquences supérieures à 4 GHz, a provoqué un tournant vers les architectures parallèles (multi-cœurs, GPU, accélérateurs matériels) pour pouvoir continuer à augmenter les performances.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
This article gives an overview of the evolution of computer architecture, specifying the place and role of each individual "hardware" item. It goes on to show the relationships between semiconductor technology, architectural concepts and the needs of large classes of applications that use these computers, either visible (PCs or servers) or embedded (onboard and mobile systems). Increased clock frequency enabled by successive generations of CMOS technology was the key factor in performance gains until the early 2000s. Now the "heat wall", prohibiting frequencies above 4 GHz, has caused a shift towards parallel architectures (multi-cores, GPU, hardware accelerators) to continue enhancing performance
Auteur(s)
-
Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur à l’Université Paris-Sud
INTRODUCTION
Cet article a deux objectifs principaux. Le premier est de donner une perspective d’ensemble de l’évolution de l’architecture des ordinateurs. Cette présentation générale permet de préciser la place et le rôle de chacun des articles particuliers de la rubrique Matériel de ce traité. Le second objectif est de montrer l’influence respective de la technologie matérielle utilisée pour la réalisation des différents composants d’une part et des progrès architecturaux, d’autre part, sur les performances des ordinateurs. Nous montrons notamment les conséquences de l’évolution exponentielle des performances des circuits intégrés CMOS et l’évolution prévisible de ces performances et des architectures dans le futur.
KEYWORDS
CPU | multi-core | GPU | CMOS technology | heat wall | memory wall
VERSIONS
- Version archivée 2 de févr. 2009 par Daniel ETIEMBLE
- Version courante de févr. 2016 par Daniel ETIEMBLE
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(238 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
5. Techniques pour aller au-delà des superscalaires
5.1 Limites des superscalaires
Les techniques superscalaires seules ne peuvent permettre simplement de garantir la poursuite d’un gain de performance de 60 % par an. S’il est relativement simple d’acquérir et traiter quatre instructions par cycle, on ne peut de manière triviale passer à huit, seize, etc. Il faut d’abord qu’il y ait suffisamment de parallélisme d’instructions dans les programmes. Le nombre d’instructions entre deux branchements est en moyenne de quatre ou cinq dans les programmes travaillant sur des nombres entiers, ce qui signifie qu’il faut prédire environ deux branchements successifs par cycle avec plus de quatre instructions par cycle. Les progrès des prédicteurs de branchements sont de plus en plus limités à mesure que l’on se rapproche de l’asymptote (100 %). Plus fondamentalement, la complexité de la partie contrôle des microprocesseurs à exécution non ordonnée augmente de manière telle qu’elle peut remettre en cause la possibilité d’utiliser des fréquences d’horloge élevées. C’est la raison pour laquelle les nouveaux microprocesseurs annoncés en 2000 utilisent une approche différente. L’évolution pour la prochaine décennie s’annonce ouverte, et nous présentons ci-après les tendances principales.
HAUT DE PAGE5.2 Approche VLIW : IA64
Alors que le superscalaire réalise par matériel en dynamique l’exécution en parallèle des instructions, l’approche « mot d’instruction très long » (VLIW) demande au compilateur de générer un mot constitué de plusieurs instructions qui sont exécutées directement par le matériel. Comme le compilateur gère les dépendances de données et le flot de contrôle, la partie contrôle du processeur est simple et permet d’utiliser des fréquences d’horloge plus élevées. L’approche VLIW, étudiée dans les années 1980, a commencé à s’imposer au milieu des années 1990 pour les processeurs de traitement du signal haut de gamme. C’est l’approche qu’ont choisie Intel et HP avec l’IA64 pour remplacer le jeu d’instructions IA32 (x86). L’une des caractéristiques des jeux d’instructions VLIW est d’utiliser des instructions avec prédicats : à toute instruction est associé...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(238 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Techniques pour aller au-delà des superscalaires
BIBLIOGRAPHIE
-
(1) - HENNESSY (J.-L.), PATTERSON (D.) - Architecture des ordinateurs, une approche quantitative. - International Thomson Publishing, édition française par D. Etiemble 1996.
-
(2) - CHEVANCE (R.-J.) - Serveurs multiprocesseurs, clusters et architectures parallèles. - Eyrolles 2000.
-
(3) - ETIEMBLE (D.) - Structure interne des ordinateurs. - H 705, 06-1993.
-
(4) - ETIEMBLE (D.) - Architecture des ordinateurs. Mémoires et entrées-sorties. - H 707, 09-1995.
-
(5) - ETIEMBLE (D.) - Composants logiques et opérateurs matériels. Fondements. - H 685, 09-1994.
-
(6) - ETIEMBLE (D.) - Mémoires à semi-conducteurs. Composants et organisation. - H 1 218, 08-1998.
-
...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(238 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive