Présentation
Auteur(s)
-
René J. CHEVANCE : Ingénieur du Conservatoire National des Arts et Métiers - Docteur ès Sciences - Conseiller Technologie et Partenariats Bull - Professeur associé au CNAM
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
On a choisi dans cet article, après avoir rappelé les concepts de base dans Systèmes à haute disponibilité- Concepts, de se concentrer sur les solutions permettant de construire des systèmes à haute disponibilité.
L’exposé est volontairement limité aux solutions applicables à la plupart des systèmes informatiques des entreprises. Ainsi, les solutions pour les systèmes à très forte criticité tels les systèmes de pilotage de processus de production chimique, de contrôle du fonctionnement de centrales nucléaires, de pilotage d’avions ou de véhicules ne sont pas abordées dans cet article.
Dans les paragraphes 1 et 2 sont exposées les solutions proposées par les constructeurs de systèmes informatiques et les fournisseurs de systèmes d’exploitation. On a classé ces solutions en deux grandes catégories :
-
les solutions de type matériel à la continuité de service ;
-
les solutions de type logiciel à la continuité de service.
Comme on le verra, l’une des solutions proposées 2.1 allie les deux approches : solution de type matériel complétée par une solution de type logiciel.
En général, ces solutions ont en commun, au niveau de la plate-forme système, le recours systématique aux techniques de masquage telles que les codes détecteurs/correcteurs d’erreurs, les chemins doubles entre les ressources matérielles...
Les solutions de type matériel ont pour objectif la tolérance aux défaillances du matériel. Elles utilisent la redondance. Les défaillances au niveau du matériel ne sont pas visibles des applications (si ce n’est un temps de réponse sensiblement accru lors de l’occurrence d’une telle défaillance, ce temps de réponse redevient ensuite tout à fait normal). Ce type de solution ne permet pas de masquer les défaillances du logiciel.
Les solutions de type logiciel ont le double objectif de tolérer à la fois les défaillances du matériel et aussi les défaillances du logiciel. En ce qui concerne le logiciel, qu’il soit système ou d’application, la tolérance aux fautes concerne essentiellement les fautes de type Heisenbug (fautes transitoires).
Il convient de noter que toutes les marques citées dans cet article sont la propriété de leurs titulaires respectifs.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
2. Solutions de type logiciel à la continuité de service
Le principe des solutions de type logiciel à la continuité de service est de mémoriser des états à partir desquels le traitement peut être repris suite à une défaillance. La définition de tels points est implicite dans les systèmes transactionnels : il s’agit des fins normales des transactions. En cas de défaillance, le système transactionnel, qui est souvent composé d’un système de gestion des transactions (par exemple : CICS sur les systèmes mainframe d’IBM, Tuxedo sur les systèmes UNIX, MTS Microsoft Transaction Service sur le système NT...) et de gestionnaires de données (par exemple DB2, Informix, Oracle ou Sybase) se sert des journaux pour annuler les effets des transactions qui n’avaient pas encore été validées au moment de la défaillance.
pour plus d’informations sur les systèmes transactionnels et leur programmation, le lecteur peut se tourner vers [17].
Nous allons analyser différentes solutions actuellement commercialisées.
2.1 Système NonStop Himalaya S7000 de Tandem
La figure 10 représente l’architecture du système NonStop Himalaya de Tandem.
Ce système présente une certaine similitude avec le système Integrity S4000 analysé au paragraphe 1.2. Il est organisé autour de ServerNet, réseau d’interconnexion « système » (que l’on appelle aussi SAN pour System Area Network ). ServerNet dispose des mécanismes d’intégrité et de redondance nécessaires. La différence, du point de vue de l’architecture du matériel, tient au fait que l’on ne dispose que d’une logique de comparaison entre les processeurs exécutant le même processus (fonction pair ) mais que l’on ne dispose pas, en cas de défaillance, d’une autre paire de processeurs capable d’assurer la poursuite...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Solutions de type logiciel à la continuité de service
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive