| Réf : H2928 v1

Problématique du stockage
Stockage des données et systèmes de fichiers

Auteur(s) : René J. CHEVANCE

Date de publication : 10 août 2005

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Cet article fait partie de la série suivante consacrée au stockage des données et aux techniques associées :

Ces articles sont extraits de l’ouvrage  lui-même traduit de . Dans le présent article, on passe en revue la problématique du stockage des données ainsi que les systèmes de gestion de fichiers.

Le stockage des données est devenu l’une des composantes fondamentales (tant du point vue opérationnel que du point de vue financier) des systèmes d’information. Il convient de remarquer que les solutions proposées par les fournisseurs de solutions de stockage présentent des caractéristiques architecturales innovantes. Le fait que les équipements de stockage n’offrent pas la possibilité d’accueillir d’autres logiciels que ceux livrés par leurs fournisseurs facilite l’innovation. En d’autres termes, de tels équipements n’accueillent pas d’applications fournies par des tiers et le problème de la compatibilité ne se pose pas comme dans le domaine des PC et des serveurs. Des changements dans les solutions technologiques, voire d’architecture, ne concernent que les fournisseurs. Dans la mesure où l’analyse de la valeur montre qu’il y a un intérêt important à changer d’architecture, les fournisseurs n’hésiteront guère à sauter le pas.

La compatibilité, qui présente de grands avantages en matière d’économie (effet d’échelle), est un frein à l’introduction de nouvelles architectures.

Les données constituant l’élément central et vital de l’informatique des entreprises, les caractéristiques des systèmes de stockage de l’information sont des facteurs importants dans le choix des serveurs. La nécessité de disposer – en permanence le plus souvent – d’informations directement accessibles (information en ligne), tant au sein d’une entreprise qu’à l’extérieur de celle-ci (au moyen d’Internet), fait de ces sous-systèmes de stockage un élément essentiel des serveurs. La tendance va vers des sous-systèmes qui comportent de plus en plus de capacité, des performances sans cesse croissantes, une disponibilité accrue, un coût rapporté à l’unité de capacité (exprimé en dollar par mégaoctet) en constante diminution et, plus récemment, des possibilités d’accès à l’information par son contenu.

On présente tout d’abord la problématique du stockage qui a motivé le développement de toutes ces nouvelles technologies et ces nouvelles approches.

On passe ensuite en revue les fonctionnalités et l’architecture des systèmes de fichiers, en centralisé et en distribué avec NFS et CIFS. On examinera les possibilités d’optimisation tant au niveau du système de fichier proprement dit (avec les systèmes de fichiers optimisés pour l’écriture) que l’exploitation des possibilités offertes par les nouvelles architectures d’entrées-sorties avec DAFS ainsi que les améliorations de performance apportées par les systèmes de fichiers parallélisés.

Des problèmes potentiels de fiabilité se posent pour le stockage d’information car les systèmes utilisent de plus en plus de disques magnétiques. L’organisation des disques en RAID Redundant Array of Inexpensive Disks fera l’objet d’un examen dans l’article « Disques magnétiques et organisation des ensembles des disques » Disques magnétiques et organisation des ensembles de disques. On y examinera aussi les techniques de virtualisation du stockage qui facilitent la gestion de ressources.

Les différentes options d’architecture tant pour le support des disques RAID que pour la virtualisation du stockage sont ensuite analysées et comparées dans l’article « Architectures de stockage » Architectures de stockage. Nous examinerons différentes approches dans ce domaine pour les sous-systèmes de stockage :

  • NAS Network Attached Storage, ou stockage attaché au réseau ;

  • SAN Storage Area Network, ou réseau dédié au stockage ou stockage en réseau où l’on accède aux données sur la base de requêtes de type accès aux disques (par exemple : commandes SCSI) ;

  • iSCSI qui permet d’accéder à des disques distants au moyen d’Internet ;

  • les techniques permettant de supporter à la fois les architectures NAS et SAN.

Les propriétés de ces différentes architectures sont comparées.

L’article « Techniques de sauvegardes et de restauration des données » Sauvegarde et restauration des données passe en revue les techniques de sauvegarde et de restauration des données. On y aborde aussi le problème de la gestion du cycle de vie de l’information (ILM Information Life cycle Management).

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h2928


Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(239 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

1. Problématique du stockage

Avant d’aborder la description des technologies, nous allons rappeler ici quelques uns des résultats publiés par l’Université de Berkeley sur les quantités d’informations produites dans le monde dans le cadre d’un projet appelé « How much information ». Avant d’aborder ces données, il n’est pas inutile de rappeler la définition de quelques unes des unités de capacité de stockage que nous allons utiliser. Elles sont indiquées dans le tableau 1.

La tableau 2 montre les quantités produites de contenus originaux au niveau mondial par an en 2002 et différenciés en fonction de leur support. Le tableau donne deux niveaux d’estimation : les estimations hautes correspondent aux volumes « bruts » de documents scannés alors que les estimations basses intègrent l’utilisation des techniques de compression et l’élimination des duplications d’information (c’est-à-dire un même contenu stocké plusieurs fois).

Il s’agit là d’une étude ambitieuse et les chiffres n’ont certainement pas été faciles à élaborer. Les hypothèses qui ont présidé à leur élaboration sont longuement détaillées dans les rapports. Ces chiffres doivent donc être interprétés comme des ordres de grandeur.

On remarquera que le papier ne représente qu’une très faible part du total (0,03 % du total). Cela ne signifie pas que l’imprimé est négligeable mais qu’il s’agit d’un mode très efficace de communication de l’information.

On estimait, qu’en 2000, le volume d’information disponible au public sur le Web était de 20 à 50 To ; en 2003, ce volume est estimé à 167 To.

Le tableau 3 montre la taille d’Internet. Le Web est constitué du Web de « surface » (pages statiques) et du Web « profond » (les sites Web pilotés par des bases de données qui permettent de créer dynamiquement des pages Web).

En 2003, environ 31 milliards de courriers ont été envoyés chaque jour. D’après IDC, ce nombre devrait doubler en 2006. La taille moyenne d’un courrier est de 59 Ko et le flot annuel de courriers représente 667 585 To.

Le tableau 4, en provenance de Horizon Information Strategies ( ...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(239 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Problématique du stockage
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - CHEVANCE (R.J.) -   Systèmes à haute disponibilité – Concepts.  -  Traité Informatique Systèmes à haute disponibilité- Concepts. Les Techniques de l’Ingénieur.

  • (2) - CHEVANCE (R.J.) -   Systèmes à haute disponibilité – Solutions.  -  Traité Informatique Systèmes à haute disponibilité- Solutions. Les Techniques de l’Ingénieur.

  • (3) - CHEVANCE (R.J.) -   Serveurs multiprocesseurs, clusters et architectures parallèles.  -  Eyrolles, avr. 2000.

  • (4) - CHEVANCE (R.J.) -   Server architectures : Multiprocessors, Clusters, Parallel Systems, Web Servers, Storage Solutions.  -  Elsevier Digital Press, déc. 2004.

  • (5) - CZEZATKE (C.), ANTON ERTL (M.) -   LinLog FS – A Log-Structured File system for Linux.  -  Usenix 2000 Freenix Track, p. 77-88.

  • (6)...

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(239 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS