Présentation
RÉSUMÉ
Cet article présente les systèmes de gestion de bases de données réparties. Il montre comment est assurée la transparence de la localisation au travers des mécanismes de fragmentation qui explicitent la répartition des données. Il décrit ensuite le processus de décomposition des requêtes en sous-requêtes adressées aux différents sites qui composent l'architecture répartie. Les fonctions de coût sont présentées qui permettent de déterminer l’arbre algébrique le plus pertinent. Enfin, ce fascicule présente le protocole de validation 'deux phases' qui garantit une exécution correcte des requêtes réparties. Tous ces concepts sont illustrés dans un cas d’application avec un système Oracle.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Guillaume CABANAC : Maître de conférences à l'Université Toulouse 3
-
Claude CHRISMENT : Professeur à l'Université Toulouse 3
-
Olivier TESTE : Professeur à l'Université Toulouse 2
-
Michel TUFFERY : Maître de conférences à l'Université Toulouse 2
INTRODUCTION
Ce fascicule présente les caractéristiques essentielles des systèmes de gestion de bases de données réparties. Répartir des données sur des ordinateurs indépendants mais interconnectés par un réseau suppose la mise en œuvre de mécanismes chargés de décrire les données, décomposer les requêtes d'accès aux données, et assurer l'intégrité globale de la base de données répartie.
Le paragraphe 1 présente l'ensemble minimal des concepts utiles à la gestion de la répartition. Le paragraphe 2 introduit les deux principales approches de conception. Le paragraphe 3 illustre le traitement des requêtes réparties avec des mécanismes de décomposition. Le paragraphe 4 est centré sur le protocole de validation à deux phases garantissant la cohérence des mises à jour des données partagées. Le paragraphe 5 illustre la façon dont la fonction de répartition est mise en œuvre dans un système opérationnel comme le SGBD Oracle.
MOTS-CLÉS
bases de données réparties données réparties fragmentation protocole de synchronisation des données
VERSIONS
- Version archivée 1 de déc. 1993 par Claude CHRISMENT, Geneviève PUJOLLE, Gilles ZURFLUH
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Big Data > Bases de données réparties > Bases de données réparties : principes et définition
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Bases de données réparties : principes et définition
1.1 Définition
Une base de données répartie (BDR) est un ensemble de bases de données (BD) manipulé comme s'il s'agissait d'une BD unique. Cependant, chaque BD est gérée par des systèmes de gestion de BD (SGBD) autonomes qui sont localisés sur des sites éventuellement distants.
HAUT DE PAGE1.2 Fonctionnalités des SGBD répartis
Ce sont les fonctionnalités classiques des BD [H 3 800] avec quatre fonctionnalités additionnelles (TDCR) :
-
transparence de la localisation via des mécanismes de fragmentation ou d'agrégation ;
-
décomposition des requêtes et agrégation des réponses aux sous-requêtes générées ;
-
cohérence des mises à jour multibase grâce au protocole de validation à deux phases (2PC pour Two Phases Commit Protocol ) ;
-
réplication des données sur les sites pour optimiser leur accès.
1.3 Architecture d'une BDR en environnement client-serveur
L'environnement de BD en environnement client-serveur est illustré par la figure 1. On parle de :
-
contexte centralisé où un client s'adresse à un serveur (représenté sur la figure 1 par un lien en pointillés longs) ;
-
contexte multibase où un client s'adresse à plusieurs serveurs (représenté sur la figure 1 par deux liens épais) ;
-
contexte réparti où un SGBD est client des autres SGBD de l'architecture répartie (représenté sur la figure 1 par un lien en pointillés courts).
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Bases de données réparties : principes et définition
BIBLIOGRAPHIE
-
(1) - CHRISMENT (C.), PINEL-SAUVAGNAT (K.), TESTE (O.), TUFFERY (M.) - Bases de données relationnelles : concepts, mise en œuvre et exercices. - Hermès-Lavoisier (2008).
-
(2) - DATE (C.J.) - An introduction to database systems. - Addison Wesley, 8e édition (2003).
-
(3) - ÖZSU (M.T.), VALDURIEZ (P.) - Principles of distributed database systems. - Springer, 3e édition (2011).
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Oracle Database 11g (11.2), environnement multiplate-forme, licence commerciale, Oracle Corporation.
HAUT DE PAGE
Site d'Oracle http://www.oracle.com/
HAUT DE PAGECet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive