Présentation
En anglaisRÉSUMÉ
Un système de gestion de bases de données (SGBD) s’évalue par ses performances et sa facilité d’usage. L’optimisation dans les SGBD est un aspect crucial des bases de données. Elle se situe à tous les niveaux : lors de la conception de l’application, où le choix de l’architecture du système, du modèle de données, des techniques de stockage et des méthodes d’accès aux données jouent un rôle important tant sur le plan de l’usage que sur celui de l’efficacité, et lors de l’utilisation où le temps de réponse aux requêtes et le nombre de transactions par seconde représentent les critères majeurs de performances.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
A database management system (DMS) can be assessed by its performances and its ease-of-use. Optimization in the DMSs is an essential aspect of the databases. It intervenes at each level: when the application is being developed where the choice of the architecture of the system, the data model, the storage techniques and access methods to data play an important part in terms of use and efficiency, and also during use, where the response time to requests and the number of transactions per second are the major performance criteria.
Auteur(s)
-
Anne DOUCET : Professeur, université Pierre-et-Marie-Curie (Paris-6)Laboratoire d’informatique de Paris-6
-
Hubert NAACKE : Maître de conférences, université Pierre-et-Marie-Curie (Paris-6)Laboratoire d’informatique de Paris-6
INTRODUCTION
Un système de gestion de bases de données (SGBD) s’évalue par ses performances et sa facilité d’usage. L’optimisation dans les SGBD, qui a pour objectif de fournir aux utilisateurs un système optimal en termes de coût et d’usage, est un aspect crucial des bases de données. Elle se situe à tous les niveaux : lors de la conception de l’application, où le choix de l’architecture du système, du modèle de données, des techniques de stockage et des méthodes d’accès aux données jouent un rôle important tant sur le plan de l’usage que sur celui de l’efficacité, et lors de l’utilisation où le temps de réponse aux requêtes et le nombre de transactions par seconde représentent les critères majeurs de performances.
Pour évaluer les performances d’un système, il est nécessaire de définir des métriques. Celles‐ci s’appuient sur différents critères, en fonction du type d’optimisation. Il peut s’agir par exemple du temps de réponse ou de l’expressivité du langage pour les requêtes, de l’espace disque occupé et du temps de parcours des données d’une relation pour le choix d’une technique de stockage, de la disponibilité des ressources ou de l’extensibilité du système lorsqu’il s’agit d’une architecture.
Ce dossier est destiné aux lecteurs ayant une connaissance générale des fonctionnalités des bases de données (modèle relationnel, SQL, transactions et contrôle de concurrence). La lecture préalable des dossiers « Bases de données. Introduction » Bases de données- Introduction, « Bases de données relationnelles » Bases de données relationnelles et « Langages de bases de données : SQL et les évolutions vers l’objet » Langages de bases de données : SQL et les évolutions vers l’objet est recommandée.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Stockage des données
Les données sont stockées durablement dans une mémoire de masse, généralement un disque dur (voir Périphériques de stockage magnétique et optique Périphériques de stockage magnétique et optique). Les données sont rangées sur des pistes circulaires concentriques découpées en plusieurs secteurs. Un bloc est formé de plusieurs secteurs contigus de la même piste et correspond à la quantité élémentaire d’information pouvant être lue ou écrite en une seule opération. La taille d’un bloc, généralement 4 ko, est fixée lors du formatage du disque et est indépendante des spécificités de la base de données.
Le temps d’accès à un bloc quelconque dépend de la durée de déplacement radial de la tête de lecture vers la piste, de la rotation du disque jusqu’à ce que le premier secteur à lire soit placé sous la tête et du temps de lecture des secteurs. Les performances d’un disque dur se mesurent avec deux valeurs : la latence correspond au temps moyen de déplacement de la tête de lecture vers une page quelconque, et le débit correspond au nombre de blocs consécutifs pouvant être lus en une unité de temps.
Pour accéder rapidement à des données stockées sur plusieurs blocs, il est important que ces blocs soient proches entre eux. L’accès à des blocs consécutifs est rapide car la tête est déjà bien positionnée en fin de chaque bloc pour lire le bloc suivant. Le gain obtenu peut être d’un facteur 10 par rapport à la lecture de blocs dispersés aléatoirement sur le disque.
Le module de gestion de l’espace disque manipule des données organisées en pages. Une page correspond généralement à un seul bloc de disque afin d’accéder à une page en une seule opération. Le rôle du gestionnaire consiste à trouver un espace libre sur le disque pour stocker une nouvelle page, et à libérer l’espace occupé par une page supprimée. Il est important, pour accélérer l’accès, que les pages lues fréquemment ensemble soient stockées dans des blocs consécutifs. Or, les données sont rarement insérées...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Stockage des données
BIBLIOGRAPHIE
-
(1) - Oracle Real Application Clusters 10g : Technical White Paper. - Oracle (2005).
-
(2) - ÖZSU (T.), VALDURIEZ (P.) - Principles of Distributed Database Systems. - Prentice Hall (1999).
-
(3) - SQL Server 2005 Analysis Services, MDX Multidimensional Expressions. - Microsoft (2005).
-
(4) - Oracle OLAP 10g Data Sheet. - Oracle (2004).
-
(5) - GARDARIN (G.) - Bases de données. - Eyrolles (1999).
-
(6) - RAMAKRISHNAN (R.), GEHRKE (J.) - Database Management Systems. - McGraw-Hill (2002).
-
(7) - GARCIA-MOLINA (H.), ULLMAN (J.), WIDOM (J.) - Database Systems : The...
DANS NOS BASES DOCUMENTAIRES
NORMES
-
Technologies de l’information. Langage de base de données SQL - NF ISO/CEI 9075 - 9-94
ANNEXES
(liste non exhaustive)
UDB, DB2, IBM http://www.ibm.com/db2
SQL Server 2005, Microsoft http://www.microsoft.com/france/sql/sql2005/
Oracle Database http://www.oracle.com/global/fr/
ASM d’Oracle 10g http://www.oracle.com/technology/products/database/asm/
MySQL, logiciel libre http://dev.mysql.com/
PostgreSQL, logiciel libre http://www.postgresql.org/
HAUT DE PAGE
Transaction Processing Performance Council (TPC) http://www.tpc.org/
World Wide Web Consortium (W3C) http://www.w3.org/
HAUT DE PAGECet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive