Présentation
Auteur(s)
-
René J. CHEVANCE : Consultant
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Cet article fait partie de la série suivante consacrée au stockage des données et aux techniques associées :
-
stockage des données et systèmes de fichiers [H 2 928] ;
-
disques magnétiques et organisation des ensembles des disques Disques magnétiques et organisation des ensembles de disques ;
-
architectures de stockage Architectures de stockage ;
-
techniques de sauvegardes et de restauration des données Sauvegarde et restauration des données.
Ces articles sont extraits de l’ouvrage lui-même traduit de . Dans le présent article, on passe en revue la problématique du stockage des données ainsi que les systèmes de gestion de fichiers.
Le stockage des données est devenu l’une des composantes fondamentales (tant du point vue opérationnel que du point de vue financier) des systèmes d’information. Il convient de remarquer que les solutions proposées par les fournisseurs de solutions de stockage présentent des caractéristiques architecturales innovantes. Le fait que les équipements de stockage n’offrent pas la possibilité d’accueillir d’autres logiciels que ceux livrés par leurs fournisseurs facilite l’innovation. En d’autres termes, de tels équipements n’accueillent pas d’applications fournies par des tiers et le problème de la compatibilité ne se pose pas comme dans le domaine des PC et des serveurs. Des changements dans les solutions technologiques, voire d’architecture, ne concernent que les fournisseurs. Dans la mesure où l’analyse de la valeur montre qu’il y a un intérêt important à changer d’architecture, les fournisseurs n’hésiteront guère à sauter le pas.
La compatibilité, qui présente de grands avantages en matière d’économie (effet d’échelle), est un frein à l’introduction de nouvelles architectures.
Les données constituant l’élément central et vital de l’informatique des entreprises, les caractéristiques des systèmes de stockage de l’information sont des facteurs importants dans le choix des serveurs. La nécessité de disposer – en permanence le plus souvent – d’informations directement accessibles (information en ligne), tant au sein d’une entreprise qu’à l’extérieur de celle-ci (au moyen d’Internet), fait de ces sous-systèmes de stockage un élément essentiel des serveurs. La tendance va vers des sous-systèmes qui comportent de plus en plus de capacité, des performances sans cesse croissantes, une disponibilité accrue, un coût rapporté à l’unité de capacité (exprimé en dollar par mégaoctet) en constante diminution et, plus récemment, des possibilités d’accès à l’information par son contenu.
On présente tout d’abord la problématique du stockage qui a motivé le développement de toutes ces nouvelles technologies et ces nouvelles approches.
On passe ensuite en revue les fonctionnalités et l’architecture des systèmes de fichiers, en centralisé et en distribué avec NFS et CIFS. On examinera les possibilités d’optimisation tant au niveau du système de fichier proprement dit (avec les systèmes de fichiers optimisés pour l’écriture) que l’exploitation des possibilités offertes par les nouvelles architectures d’entrées-sorties avec DAFS ainsi que les améliorations de performance apportées par les systèmes de fichiers parallélisés.
Des problèmes potentiels de fiabilité se posent pour le stockage d’information car les systèmes utilisent de plus en plus de disques magnétiques. L’organisation des disques en RAID Redundant Array of Inexpensive Disks fera l’objet d’un examen dans l’article « Disques magnétiques et organisation des ensembles des disques » Disques magnétiques et organisation des ensembles de disques. On y examinera aussi les techniques de virtualisation du stockage qui facilitent la gestion de ressources.
Les différentes options d’architecture tant pour le support des disques RAID que pour la virtualisation du stockage sont ensuite analysées et comparées dans l’article « Architectures de stockage » Architectures de stockage. Nous examinerons différentes approches dans ce domaine pour les sous-systèmes de stockage :
-
NAS Network Attached Storage, ou stockage attaché au réseau ;
-
SAN Storage Area Network, ou réseau dédié au stockage ou stockage en réseau où l’on accède aux données sur la base de requêtes de type accès aux disques (par exemple : commandes SCSI) ;
-
iSCSI qui permet d’accéder à des disques distants au moyen d’Internet ;
-
les techniques permettant de supporter à la fois les architectures NAS et SAN.
Les propriétés de ces différentes architectures sont comparées.
L’article « Techniques de sauvegardes et de restauration des données » Sauvegarde et restauration des données passe en revue les techniques de sauvegarde et de restauration des données. On y aborde aussi le problème de la gestion du cycle de vie de l’information (ILM Information Life cycle Management).
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Accès aux fichiers distants NFS, CIFS et DAFS
Différentes possibilités existent pour l’accès aux fichiers distribués : NFS (Network File System) et CIFS (Common Internet File System) sont les plus répandus.
DAFS pour Direct Access File System permet d’exploiter les possibilités offertes par les technologies VI (Virtual Interface Architecture) ou bien d’InfiniBand dans un contexte de réseau local.
Avant d’apprécier les apports de DAFS, nous allons présenter NFS et CIFS.
4.1 NFS Network File System
La figure 9 illustre les couches fonctionnelles, pour ce qui concerne le client, mises en œuvre pour l’accès aux fichiers dans le cas d’un système de fichiers local et dans le cas de fichiers distants.
Pour plus de lisibilité, ce schéma comporte quelques simplifications (par exemple, on n’a pas fait figurer le bus SCSI). Toujours dans un but de simplification du schéma, on s’est placé dans l’hypothèse où les disques sont directement attachés au système client (DAS) au moyen d’un bus SCSI.
Dans la partie gauche de la figure 9, on a illustré le cas de l’accès à un système de fichiers local (hors du contexte NFS).
Dans le cas où l’accès à des fichiers distants au moyen de NFS est mis en œuvre, le système est appelé Client NFS. Sur ce client NFS, à partir de l’interface programmatique (API Programmatic Programming Interface ), la fonction File System Switch détermine s’il s’agit d’un accès local à traiter par le système de fichiers local ou d’un accès distant devant être pris en compte par NFS. Le système de fichiers se charge de la réalisation de l’opération en mettant en jeu, le cas échéant, les entrées-sorties. Comme le montre la figure 9, il y a mouvement de données entre l’espace utilisateur et l’espace système.
Dans le cas d’un accès distant, NFS est mis en jeu. Lorsque l’opération ne peut être exécutée avec le cache local (par exemple, absence de la donnée dans le cache du client lors d’une opération de lecture), un message est adressé au système supportant le fichier accédé. Les appels aux serveurs sont pris en charge par le mécanisme de RPC (Remote Procedure Call ou appel de procédure à distance). XDR (pour eXternal...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Accès aux fichiers distants NFS, CIFS et DAFS
BIBLIOGRAPHIE
-
(1) - CHEVANCE (R.J.) - Systèmes à haute disponibilité – Concepts. - Traité Informatique Systèmes à haute disponibilité- Concepts. Les Techniques de l’Ingénieur.
-
(2) - CHEVANCE (R.J.) - Systèmes à haute disponibilité – Solutions. - Traité Informatique Systèmes à haute disponibilité- Solutions. Les Techniques de l’Ingénieur.
-
(3) - CHEVANCE (R.J.) - Serveurs multiprocesseurs, clusters et architectures parallèles. - Eyrolles, avr. 2000.
-
(4) - CHEVANCE (R.J.) - Server architectures : Multiprocessors, Clusters, Parallel Systems, Web Servers, Storage Solutions. - Elsevier Digital Press, déc. 2004.
-
(5) - CZEZATKE (C.), ANTON ERTL (M.) - LinLog FS – A Log-Structured File system for Linux. - Usenix 2000 Freenix Track, p. 77-88.
-
(6)...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(240 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive