Technologies RAID
INTRODUCTION
Le principe de la tolérance de panne consiste à mettre en place des méthodes ou des outils permettant à un système de continuer à fonctionner lorsqu'un incident intervient.
L'objectif principal est que cela soit transparent pour l'utilisateur, l'administrateur, quant à lui, sera informé de la panne et fera tout ce qui est en son pouvoir pour permettre au système de retrouver son état d'origine.
En effet, lorsque l'incident intervient, le système doit pouvoir continuer de fonctionner certes, mais bien souvent avec des performances moindres, c'est ce qu'on appelle un mode dégradé.
Ce principe de tolérance de panne peut concerner différents éléments du système informatique, l'objet de la présente fiche s'attache à l'étude des systèmes de stockage et tout particulièrement les disques.
Il ne faut pas confondre le principe du RAID lié à la tolérance de panne et la notion de sauvegarde dont l'objectif est de faire une image du système d'information à un instant t pour être utilisé en cas de sinistre majeur dans le cadre d'un PRA (Plan de Reprise d'Activité).
PRINCIPE
Les technologies RAID s'inscrivent donc dans le principe de tolérance de panne dont l'objectif est d'assurer une continuité de service en mode normal ou dégradé suite à un incident.
Ces techniques s'appliquent au niveau des données du système d'information et sont complémentaires à d'autres méthodes de protection concernant les autres ressources (redondance de serveurs, de matériels d'interconnexion…).
Assurer la disponibilité des données consiste à mettre en œuvre des procédures permettant de réduire au maximum la gêne provoquée par une défaillance technique du système d'accès à ces données.
Les problèmes peuvent être d'ordre logique ou physique, accidentel ou intentionnel. Diverses réponses sont possibles suivant le type d'incident.
Le RAID (Redundant Array of Inexpensive/Independent Disks) est un moyen d'assurer une tolérance de panne sur les supports de stockage de données.
Ce système comporte différents niveaux (0 à 6) qui correspondent chacun à un mode d'organisation différent.
Néanmoins, chacun de ces niveaux répond à une problématique et à un objectif différent. De plus, il faut savoir que le principe de tolérance de panne n'est pas systématiquement atteint.
En effet, le niveau 0 du RAID est plus un mode d'organisation des données qu'un véritable système de sécurisation comme cela est montré ci-après.
Le principe du RAID peut être implémenté de façon logicielle ou matérielle.
RAID Logiciel
Dans le cas du RAID logiciel, c'est le système d'exploitation qui gère lui-même les accès disques de façon sécurisée alourdissant ainsi son travail et ses besoins en ressources (processeur et bus système).
L'accès aux disques est alors, en général, assuré que par un seul contrôleur.
Les avantages d'une solution logicielle sont :
- Souplesse d'utilisation et d'administration,
- Grande interopérabilité : il est possible de passer d'une machine à une autre sans problème, la seule condition étant de conserver la couche logicielle, c'est à dire le même système d'exploitation,
- Solution gratuite.
Les inconvénients :
- Moins bonne performance qu'un contrôleur matériel en termes de diagnostic et de détection d'un élément défaillant,
- Solution gourmande en ressources systèmes de la part du système d'exploitation,
- Dépendance envers le système d'exploitation, tous ne gèrent pas l'ensemble des modes RAID.
RAID Matériel
Le RAID matériel est assuré par un composant indépendant sous forme de carte d'extension ou relié aux disques.
Ce matériel dispose d'éléments, tels processeur, mémoire et batterie de secours, qui le rendent autonome. Le système d'exploitation est déchargé des opérations disques et le matériel RAID peut assurer des opérations de maintenance ou de surveillance des disques.
L'organisation des disques physiques est totalement transparente pour le système d'exploitation.
Les avantages d'une solution matérielle sont :
- Reconstruction autonome des piles RAID en cas de changement de matériel,
- Possibilité de remplacement à chaud d'un disque dur,
- Toutes les opérations sont assurées par le contrôleur RAID, ce qui allège le rôle du processeur et du bus système.
Les inconvénients :
- La structure RAID est très dépendante du contrôleur utilisé, ce qui peut occasionner des problèmes en cas de panne, car il faut retrouver un modèle similaire,
- Le coût plus important qu'un système logiciel.
LES DIFFÉRENTS NIVEAUX DE RAID
RAID 0 : Agrégat par bande
Le RAID 0 est donc un système d'organisation des données. Le principe est de répartir ces données sur plusieurs disques physiques, l'utilisateur ne voyant qu'un seul disque.
Le nombre minimum de disques composant le disque logique est de 2.
L'espace disque total disponible est constitué par l'addition des espaces des disques composant le disque logique.
L'avantage d'une telle organisation est d'améliorer les accès disque et d'accélérer ainsi la vitesse de transfert des informations puisque le système peut accéder en même temps à plusieurs disques physiques.
Le principe est plutôt dédié à des systèmes souhaitant optimiser les performances d'accès aux données temporaires et privilégiant un taux élevé d'entrées/sorties.
Le principe de l'agrégat par bande est basé sur le fait que les blocs de données de même niveau sur les différents disques physiques sont assemblés au sein de bandes de données.
RAID 1 : Mirroir
Le principe du miroir repose sur la redondance de deux volumes simples identiques. Toutes les informations sont écrites en double sur deux lecteurs physiques.
Dans cette situation encore, les deux volumes physiques ne sont vus qu'au travers d'un seul volume logique par l'utilisateur.
L'inconvénient principal de cette méthode est que seulement 50% de l'espace disque est utilisé pour stocker les données utiles, les autres 50% sont constitués par les données de sécurité. Ceci est compensé par le faible coût des supports de stockage.
En cas de problème sur une des deux composantes du miroir, le volume non affecté continue d'être utilisé en autonome jusqu'à la réparation du volume endommagé.
Il s'agit là d'une véritable solution de tolérance de panne puisque la défaillance d'un disque n'empêche pas le fonctionnement du système. Celui-ci continue d'être accessible mais en mode dégradé donc sans protection tant que le disque endommagé n'est pas remplacé et que le miroir n'est pas reconstitué.
Cette méthode est surtout utilisée pour les petits systèmes où une capacité d'un disque est suffisante et pour les applications nécessitant une disponibilité très élevée.
RAID 5 : Agrégat par bande avec parité
Un volume RAID5 est un volume agrégé par bande avec parité composé d'au moins trois disques physiques.
Les informations de parités sont constituées par un bloc de données pour la bande ; le bloc de parité de chaque bande étant situé sur un disque différent. Ce bloc sera utilisé pour régénérer des données d'un disque endommagé (si plusieurs disques sont endommagés, la récupération n'est pas possible !).
Dans ce système de tolérance de panne, de 3 à 32 lecteurs peuvent être gérés. Toutes les partitions, à l'exception des partitions système et d'amorçage, peuvent faire partie d'un agrégat par bandes avec parité.
Il est à noter que toutes les opérations d'écritures nécessitent trois fois plus de mémoire en raison du calcul de la parité ce qui ralentit les performances en écriture.
L'ensemble des blocs de même niveau sur chaque disque forme une bande (ici A, B, C par exemple). Parmi ces blocs, un d'entre eux est utilisé pour la sécurité (la parité) et les autres pour les données.
Cette parité est, en fait, le résultat d'un calcul assuré par un algorithme sur l'ensemble des blocs de données de la même bande.
Si un disque est défaillant, il est donc possible de retrouver les informations manquantes grâce à l'algorithme utilisé.
Un des principaux avantages de la méthode, hormis la tolérance de panne, est le pourcentage élevé de capacité de stockage pour les données dites utiles. En effet, pour un agrégat de quatre disques, l'équivalent de trois disques est utilisé pour le stockage et un disque pour la sécurité.
Le système permettant l'utilisation d'un grand nombre de disques, d'une manière générale, pour n disques composant l'agrégat, la capacité utile est constituée de la capacité équivalant à n-1 disques. De même, l'espace occupé pour la sécurité représente l'équivalent d'un disque soit 1/n de l'espace.
A noter que l'espace utilisé sur chaque disque physique doit être équivalent. Suivant le système pilote utilisé, il est donc possible d'intégrer des disques de capacités différentes dans l'agrégat.
Ce système est utilisé pour des grandes quantités de stockage.
RAID 6 : Agrégat par bande avec double parité
Le RAID 6 est une évolution du RAID 5 où deux blocs (et non 1) servent à la sécurité.
En effet, cela permet de gérer la défaillance de 2 disques, ce qui n'est pas le cas dans les autres niveaux de RAID présentés ci-dessus.
Néanmoins, l'avantage procuré par la sécurité est contrebalancé par les pertes en performances ; celles-ci se situent aussi bien lors des phases d'écriture où les calculs complexes ralentissent l'exécution que lors des phases de reconstitution d'agrégat suite à une défaillance.
De même, l'espace disque dédié au volume utile des données est moindre puisque la parité utilise deux blocs de données sur l'ensemble de la bande.
Il existe de multiples autres niveaux de RAID. Ces niveaux constituent en fait une combinaison des systèmes de base (0,1,5 et 6).
Combinaisons avec le RAID 0 et le RAID 1
RAID 10
Le RAID 10 est un RAID 1+0 où sont associés le RAID 1 (Miroir) et le RAID 0 (stripping ou entrelaçage de données).
Il est donc nécessaire de disposer d'au moins quatre disques pour constituer des grappes de disques qui seront regroupées dans une seule unité logique.
Le système obtenu est une organisation basée sur l'agrégat par bande RAID 0 disposant d'une tolérance de panne de type miroir.
La capacité de stockage utile est, comme pour le miroir, de la moitié de l'espace physique total.
RAID 01
Ce système est l'inverse du précédent mais il est toujours basé sur une combinaison des configurations RAID 0 et RAID 1.
Il est toujours nécessaire de disposer d'un minimum de quatre disques physiques. Les disques sont associés dans un premier temps selon le principe RAID 0 de l'agrégat par bande (stripping) puis dupliqués selon le principe du miroir.
Là encore, la capacité utile est égale à la moitié de la capacité physique totale.