Présentation
Auteur(s)
-
René J. CHEVANCE : Consultant
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Cet article fait partie de la série suivante consacrée au stockage des données et aux techniques associées :
-
stockage des données et systèmes de fichiers [H 2 928] ;
-
disques magnétiques et organisation des ensembles des disques Disques magnétiques et organisation des ensembles de disques ;
-
architectures de stockage Architectures de stockage ;
-
techniques de sauvegardes et de restauration des données Sauvegarde et restauration des données.
Ces articles sont extraits de l’ouvrage lui-même traduit de . Dans le présent article, on passe en revue la problématique du stockage des données ainsi que les systèmes de gestion de fichiers.
Le stockage des données est devenu l’une des composantes fondamentales (tant du point vue opérationnel que du point de vue financier) des systèmes d’information. Il convient de remarquer que les solutions proposées par les fournisseurs de solutions de stockage présentent des caractéristiques architecturales innovantes. Le fait que les équipements de stockage n’offrent pas la possibilité d’accueillir d’autres logiciels que ceux livrés par leurs fournisseurs facilite l’innovation. En d’autres termes, de tels équipements n’accueillent pas d’applications fournies par des tiers et le problème de la compatibilité ne se pose pas comme dans le domaine des PC et des serveurs. Des changements dans les solutions technologiques, voire d’architecture, ne concernent que les fournisseurs. Dans la mesure où l’analyse de la valeur montre qu’il y a un intérêt important à changer d’architecture, les fournisseurs n’hésiteront guère à sauter le pas.
La compatibilité, qui présente de grands avantages en matière d’économie (effet d’échelle), est un frein à l’introduction de nouvelles architectures.
Les données constituant l’élément central et vital de l’informatique des entreprises, les caractéristiques des systèmes de stockage de l’information sont des facteurs importants dans le choix des serveurs. La nécessité de disposer – en permanence le plus souvent – d’informations directement accessibles (information en ligne), tant au sein d’une entreprise qu’à l’extérieur de celle-ci (au moyen d’Internet), fait de ces sous-systèmes de stockage un élément essentiel des serveurs. La tendance va vers des sous-systèmes qui comportent de plus en plus de capacité, des performances sans cesse croissantes, une disponibilité accrue, un coût rapporté à l’unité de capacité (exprimé en dollar par mégaoctet) en constante diminution et, plus récemment, des possibilités d’accès à l’information par son contenu.
On présente tout d’abord la problématique du stockage qui a motivé le développement de toutes ces nouvelles technologies et ces nouvelles approches.
On passe ensuite en revue les fonctionnalités et l’architecture des systèmes de fichiers, en centralisé et en distribué avec NFS et CIFS. On examinera les possibilités d’optimisation tant au niveau du système de fichier proprement dit (avec les systèmes de fichiers optimisés pour l’écriture) que l’exploitation des possibilités offertes par les nouvelles architectures d’entrées-sorties avec DAFS ainsi que les améliorations de performance apportées par les systèmes de fichiers parallélisés.
Des problèmes potentiels de fiabilité se posent pour le stockage d’information car les systèmes utilisent de plus en plus de disques magnétiques. L’organisation des disques en RAID Redundant Array of Inexpensive Disks fera l’objet d’un examen dans l’article « Disques magnétiques et organisation des ensembles des disques » Disques magnétiques et organisation des ensembles de disques. On y examinera aussi les techniques de virtualisation du stockage qui facilitent la gestion de ressources.
Les différentes options d’architecture tant pour le support des disques RAID que pour la virtualisation du stockage sont ensuite analysées et comparées dans l’article « Architectures de stockage » Architectures de stockage. Nous examinerons différentes approches dans ce domaine pour les sous-systèmes de stockage :
-
NAS Network Attached Storage, ou stockage attaché au réseau ;
-
SAN Storage Area Network, ou réseau dédié au stockage ou stockage en réseau où l’on accède aux données sur la base de requêtes de type accès aux disques (par exemple : commandes SCSI) ;
-
iSCSI qui permet d’accéder à des disques distants au moyen d’Internet ;
-
les techniques permettant de supporter à la fois les architectures NAS et SAN.
Les propriétés de ces différentes architectures sont comparées.
L’article « Techniques de sauvegardes et de restauration des données » Sauvegarde et restauration des données passe en revue les techniques de sauvegarde et de restauration des données. On y aborde aussi le problème de la gestion du cycle de vie de l’information (ILM Information Life cycle Management).
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
2. Niveaux fonctionnels. Systèmes de fichiers
Dans ce paragraphe, nous allons passer en revue les différents composants logiciels mis en œuvre dans l’accès aux données.
Nous allons tout d’abord résumer les grandes caractéristiques d’un système de fichiers et nous examinerons ensuite les différentes couches fonctionnelles mises en jeu au sein d’un système pour les accès aux fichiers.
La figure 3 illustre la fonctionnalité d’un système de fichiers avec les trois fonctions principales d’un système de fichier : la résolution des noms de fichier, la résolution des adresses logiques (offset et longueur) pour l’accès à l’information et la fonction de gestionnaire du cache disque. La méthode d’accès aux informations est de type « basique » car elle ne suppose pas une organisation des informations au sein du fichier. En effet, on peut bâtir des méthodes plus sophistiquées au-dessus de cette méthode de base telles que les méthodes d’accès de type séquentiel indexé (par exemple, C-ISAM, VSAM). Dans un but de simplification, on n’a pas fait figurer explicitement le système d’exploitation. De fait, le système de gestion de fichiers fait, généralement, partie du système d’exploitation tandis que le SGBD, sauf cas particulier, n’en fait pas partie.
Un système de fichiers a donc trois fonctions principales.
Résolution des noms et gestion des droits d’accès. D’une façon classique depuis le système Multics, l’ensemble des noms de fichiers est organisé en une structure arborescente avec un mode de désignation au moyen d’expressions qualifiées (on désigne un fichier ou un groupe de fichiers par la liste des noms depuis le répertoire racine, ou une sous-racine, jusqu’à une feuille ou bien une sous-arborescence).
référence / Specs/ Project B/ Software de la figure 3.
Lorsqu’une application souhaite accéder à un fichier, elle se référence au moyen de son nom symbolique et c’est le système de fichiers qui fait correspondre à une telle référence symbolique les éléments qui décrivent la réalisation du fichier sur les disques.
Multics ...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Niveaux fonctionnels. Systèmes de fichiers
BIBLIOGRAPHIE
-
(1) - CHEVANCE (R.J.) - Systèmes à haute disponibilité – Concepts. - Traité Informatique Systèmes à haute disponibilité- Concepts. Les Techniques de l’Ingénieur.
-
(2) - CHEVANCE (R.J.) - Systèmes à haute disponibilité – Solutions. - Traité Informatique Systèmes à haute disponibilité- Solutions. Les Techniques de l’Ingénieur.
-
(3) - CHEVANCE (R.J.) - Serveurs multiprocesseurs, clusters et architectures parallèles. - Eyrolles, avr. 2000.
-
(4) - CHEVANCE (R.J.) - Server architectures : Multiprocessors, Clusters, Parallel Systems, Web Servers, Storage Solutions. - Elsevier Digital Press, déc. 2004.
-
(5) - CZEZATKE (C.), ANTON ERTL (M.) - LinLog FS – A Log-Structured File system for Linux. - Usenix 2000 Freenix Track, p. 77-88.
-
(6)...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(239 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive