Dans un ordinateur, les données sont contenues dans des disques qui peuvent tomber en panne à tout moment. Afin de préserver les données et la productivité, les disques sont toujours agencés en RAID. Le niveau le plus simple est le RAID1. Celui-ci assure que chaque donnée est copiée sur deux disques en même temps. Si l’un d’eux tombe en panne, les données sont disponibles sur l’autre.
Pourtant, le RAID1 n’est pas le plus utilisé en entreprise. Le RAID5 reste la solution la plus courante. En effet, le RAID1 a des restrictions qui limitent son usage. Le RAID1 ne peut se faire qu’avec 2 disques et la capacité définitive n’est que de 50% de la capacité totale des disques installés.
Si on construit un RAID1 avec 2 disques de 3 Tb, on a engagé 6 Tb de stockage mais le RAID résultant offre 6 Tb.
Au contraire, le RAID5 peut être construit avec un minimum de 3 disques. Cependant, rien n’interdit de construire un RAID5 avec 8, 14 ou 20 disques. Il n’y a pas de limite vers le haut. Ceci permet d’obtenir de grands espaces de stockage servis par beaucoup de disques. Beaucoup de disques signifie une plus grande capacité du système à faire face à de nombreuses requêtes. Si on utilise 3 disques pour un RAID5, on a une capacité résultante de 2 disques. Donc un RAID5 construit avec 3 disques de 2 Tb, aura une capacité de 5 Tb. La perte est de l’ordre de 33% mais elle devient moins importante avec le nombre de disques installés.
Un RAID5 construit avec 5 disques de 2 Tb a une capacité de stockage de 8 Tb. On ne perd que 20% de stockage dans ce cas.
Le RAID5 éclate la donnée entre les disques disponibles moins un. Par exemple, si on a un RAID5 construit sur la base de 3 disques, une donnée qui arrive est divisée en deux et chaque morceau est écrit sur un disque. Puis, le contrôleur RAID réalise une opération mathématique (parité) sur les deux morceaux et le résultat est écrit sur le troisième disque. La prochaine donnée sera divisée de la même manière, mais une autre paire de disques reçoit les fragments de data et le troisième le résultat de l’opération mathématique (parité).
Dans l’exemple ci-dessus, chaque disque va contenir 2/3 de données et 1/3 de résultats de parité. C’est pour cette raison que la capacité totale de ce RAID est amputée de 33%. C’est l’espace que viennent prendre les résultats de parité.
Que ce passe-t-il en cas de panne d’un disque ?
On va chercher une donnée et 2 scenarios sont possibles :
1 – Pour cette donnée là, tous les fragments sont disponibles sur les disques restants. Il suffit de les lire comme sur un RAID0.
2 – Un fragment de la donné est manquant. Dans ce cas, on utilise les fragments disponibles ainsi que l’information de parité correspondant et on réalise l’opération mathématique consistant à deviner la partie manquante d’une opération mathématique dont on connait le résultat.
Voici un exemple de ce concept :
1 + 3 + 5 = 9
Supposons que le disque qui contienne le 5 soit en panne. Il vous restera l’équation :
1 + 3 + X = 9
Le 9 vient du disque qui contient la parité. Il est facile de deviner l’information manquante. Bien sûr, le RAID5 ne fait pas une opération d’addition.
Quand un RAID5 perd un disque, le serveur continue à fonctionner normalement. Si la machine tournait à pleine charge, elle sera encore plus ralentie et la dégradation de performance sera sensible. Il suffit de remplacer le disque défaillant (souvent signalé par une LED rouge) et le contrôleur RAID s’occupe de l’imager à l’identique que le disque défaillant. Pendant tout ce temps, les données sont disponibles normalement en lecture et écriture.







