C’est quoi le raid ?
Sans aucun doute, les disques durs de ces serveurs sont en RAID.
Mais qu’est-ce que ça signifie RAID ?
Quelle est la différence entre RAID 0 et RAID 1 ou entre RAID 1 et RAID 5 ?
Petit rappel sur les disques durs
Pour bien comprendre de quoi nous allons parler, commençons par un tout petit rappel sur les disques durs. Un disque dur est un périphérique de stockage qui est composé des pièces mécaniques (pour les HDD) et de pièces électroniques, et exclusement de composant électronique pour les disques durs SSD.
N’hésitez pas à relire : c’est quoi un disque dur ? ou C’est quoi un disque dur SSD ?
Comme tout équipement, celui-ci peut tomber en panne.
Les disques de dernière génération sont extrêmement fiable, mais malgré cela, il n’existe pas de disque dur fiable à 100% (qui ne tombera jamais en panne).
Lorsque le disque dur tombe en panne (ou qu’une partie du disque est illisible) alors les données qui sont écrites dessus sont perdues. Cela peut-être dramatique dans certains cas. Il fallait donc trouver une solution à ce problème. C’est ce qu’apporte le RAID.
Rappel du principe d’utilisation d’un disque dur.
Je vous rappelle que dans un ordinateur (ou un serveur), le processeur n’accède pas directement au disque dur. Il passe toujours par une carte qui s’appelle « carte contrôleur ». Voici un petit schéma pour résumer tout ça :
Les volumes
On comprend aisément, en regardant le schéma au-dessus, que les valeurs du disque (nom, d’espace total, d’espace libre, …) sont fournies par le contrôleur de disque au processeur (et pas directement par le disque). On parle alors de volume. Retenez que Le volume est une vue du stockage (on parle parfois aussi d’unité logique).
Alors si on met 2 disques dur derrière la carte contrôleur, on pourrait voir ça de 2 façons :
Comme on peut le voir sur le schéma, le système ne voit pas les disques. C’est le contrôleur de disques qui présentent la vue des disques.
Voila, vous êtes prêts maintenant à comprendre ce qu’est le RAID.
Les différents RAID possibles
En fait, il n’existe pas un RAID, mais différents types de RAID. La technologie RAID peut faire intervenir dans la solution proposée un nombre différents de disques et proposer ainsi des niveaux de sécurité différents. Je ne vais m’attarder que sur les plus célèbres et les plus utilisés.
Attention, tous les types de niveau ne sont pas conçus avec pour objectif la sécurité des données. (nous y reviendrons). Pour l’instant attardons nous sur le RAID 1 et le RAID 5. C’est 2 types permettent de sécuriser les données de façons différentes.
RAID 1
Le RAID1 est très utilisé dans les petites entreprises sur les petits serveurs car il n’utilise que 2 disques, il est aussi appelé Mirroring. Le principe est simple chaque information est copiée en double, ainsi, si un disque dur lâche, il reste l’autre disque. Voici ce que ça donne sur un schéma :
L’inconvénient de ce type de raid est qu’il faut 2 disques. Et que l’on perd la moitié de l’espace car les mêmes choses sont copiés sur les 2 disques. (Si vous avez 2 disques de 500 Go, vous n’aurez un volume disponible que de 500 Go).
L’avantage c’est qu’il est simple et que les cartes contrôleur ne nécessite pas de puissance importantes pour gérer le système.
Lorsque l’un des disques tombé en panne est remplacé par un nouveau, le système va recopier l’ensemble des données du disque sain vers le nouveau et le système est à nouveau opérationnel rapidement.
RAID 5
L’idée du raid 5 est de répartir les données à enregistrer sur plusieurs disques (au minimum 3), de les découper en plusieurs parties et de calculer une dernière partie appelée « parité » entre les données. Cette parité est calculée à partir des données et sera enregistrée sur un des disques. A partir de cette parité, il est possible de reconstruire les données manquantes.
Cette opération de calcul est réversible, c’est à dire que :
- à partir des données, il est possible de recalculer la parité
- et qu’il est possible de recalculer un morceau manquant à partir de la parité et des autres morceaux de données.
Prenons un exemple d’un raid 5 constitué de 4 disques et d’un fichier : ABCDEFGH.
- on peut découper le fichier en 3 morceaux : ABC, DEF, et GH
- le raid va calculer un parité « P »
- on écrit ensuite sur 3 disques les 3 morceaux de fichiers « ABC », « DEF », « GH »
- et enfin sur le dernier disque, on écrit la parité « P ».
Voila ce que ça donne sur un petit schéma :
Comme on peut le voir sur le schéma, la parité est répartie sur les différents disques. (elle n’est pas toujours écrite sur le même disque).
La panne en raid 5
Imaginons maintenant que le disque 2 tombe en panne. Vous allez alors mettre un nouveau disque vierge dans le lecteur.
Le système raid 5 va détecter ce nouveau disque et va commencer une opération appelée : reconstruction du raid (ou reconstruction du disque).
En fait cette opération consiste à remettre les données telles qu’elles étaient avant la panne de l’ancien disque, pour cela le système va lire les données des autres disques et reconstruire les données à partir des morceaux ou de la parité.
Pendant cette opération, vous pouvez toujours utiliser votre ordinateur car celui-ci fonctionne toujours, mais les accès disques seront un peu plus long car le système raid est occupé à reconstruire les données. Sur les volumes de plusieurs Terra Octets cela peut prendre plusieurs jours.
Avantages du raid 5.
Le raid 5 cumule plusieurs avantages :
- il y a beaucoup moins d’espace disque perdu qu’en raid 1. En effet, il n’y a que la valeur d’un seul disque de perdu. Le calcul du volume d’un système raid 5 est d’ailleurs : (Nombre de disque – 1) x Taille du plus petit disque.
Exemple : avec 5 disques de 500 Go en raid 5 : le volume disponible est de 2 To : (5 disques -1) x 500 = 2To. - Le système raid 5 permet une lecture bien plus rapide qu’un raid 1. En effet, le goulet d’étranglement en lecture : c’est le disque lui-même (rappelez-vous le temps de déplacement des têtes et la rotation du disque). En répartissant la lecture sur plusieurs disques : on divise les temps d’accès.
Inconvénient du raid 5.
Un des gros inconvénients, c’est que pendant la phase de reconstruction du raid (suite à changement de disque), le système est fragilisé car si un 2ème disque tombe en panne, alors c’est tout le système qui s’écroule. Avouez que ça ne serait pas de bol que 2 disques tombent en panne à quelques heures d’intervalle.
Un autre inconvénient du raid 5 est la perte d’une partie de la capacité: si vous prenez 5 disques pour les mettre en raid 5, vous n’aurez pas au final la capacité égale à la somme des 5 capacités. Vous pouvez le constater en regardant ici le calculateur de raid 5.
Et pour votre culture, quand on parle des disques en RAID, on parle d’une grappe de disques.
Dans la 2ème partie, nous verrons un système très utilisé chez les particuliers et les petites entreprises et vous verrez qu’il n’est pas du tout sécurisé.
Nous verrons également quelques alternatives au Raid 5 qui permettent de corriger son gros défaut ainsi que la notion de hotspare.
Vous trouverez cet article ici : C’est quoi le RAID – Partie 2 ?
bonjour,
un truc me semble étrange
dans les aventage d’un raid 5 vous dite:
Le système raid 5 permet une lecture bien plus rapide qu’un raid 1. En effet, le goulet d’étranglement en lecture : c’est le disque lui-même (rappelez-vous le temps de déplacement des têtes et la rotation du disque). En répartissant la lecture sur plusieurs disques : on divise les temps d’accès.
mais en raid 1 les donné son sur tout les discs, donc peu veut être lus sur tout les disc
donc un raid 1 est plus rapide en lecture qu’une raid 5
je me trompe?
Bonjour Codati,
ou mais généralement en RAID 1, on n’a généralement que 1 disque (l’autre disque ne servant qu’en secours),alors qu’en RAID 5, il y en a au minimum 3 : donc la lecture se fait au minimum sur 3 disques !
A bientôt
Très bien expliqué. Clair simple et concis. Bravo et merci !!!!
Svp je n’ai pas compris la paticularite du raid 5
Bonjour Rose,
la particularité du raid5, c’est que les données sont écrites sur plusieurs disques (un bout sur chaque), et un bout appelé Parité est écrit sur un autre disque. L’avantage, c’est que si une disque tombe en panne, le système continue à tourner.
A bientôt
Bonjour
j’ai toujours du mal a comprendre la fonctionnalité du Parité et comment celle-ci a été calcule .
MERCI
Salut Kader,
relis bien la partie sur le raid 5 : j’explique comment est calculée la parité.
A bientôt
Pour bien comprendre ce qu’est une erreur et comment la parité entre en action Ben Eater à fais une vidéo superbe.
https://www.youtube.com/watch?v=MgkhrBSjhag
😉
Oui, c’est très bien mais c’est dommage que ce soit en anglais : je ne suis pas sur que tout le monde comprenne !
A bientôt
Bonjour,
Que se passe t il si le disque dur contenant la parité tombe en panne ?
Merci
Bonjour Mat,
lorsque la parité est mise en place (Raid5 ou Raid6) alors celle-ci est répartie sur plusieurs disques. Donc quand un disque tombe en panne, la parité est reconstituée à partir des autres disques : c’est tout l’intérêt.
A bientôt
Bien que je sois le premier a commenter malgré ce cour n’est pas complète! déjà je suis seduire par ce cour qui me semble beaucoup plus important!!!