Stockage 3/4 - Baies & RAID

Le stockage photo 3/4 – Baies & RAID

Série d’articles par Robin MORET

Troisième billet d’une série d’articles dédiés au stockage de nos photos et vidéos, avec un focus sur les solutions de types de NAS (Network Attached Storage). Cette série a pour vocation de vous sensibiliser à la problématique de la sauvegarde pérenne des précieux fichiers photos que nous mettons tant d’ardeur et de moyens à réaliser, à post-traiter, mais rarement à sauvegarder…

Ces articles accompagnent les vidéos que j’avais réalisées en 2022 sur le sujet. L’article constitue « la version courte » et je vous invite à visionner la vidéo en bas de l’article pour plus de détails.

Vous avez raté le précédent article ? C’est par ici >>>> Le stockage 2/4

Quand le RAID débarque

Les NAS utilisent un système d’écriture sur les disques assez différent de ce que vous connaissez sur PC. Vous êtes habitués à ce que chaque disque contienne une arborescence de répertoires. Eux mêmes contiennent des fichiers, et vous savez dire quel fichier est sur quel disque.

Le NAS utilise une autre façon de faire. Il regroupe plusieurs disques en un « volume logique ». Il utilise tous les disques au sein de ce volume en parallèle et distribue le contenu de chaque fichier parmi les disques disponibles. C’est la méthode qu’on appelle le système RAID (Redundant Array of Independant Disks). Cela présente un premier grand avantage : la capacité à lire/écrire les fichiers beaucoup plus vite. En effet, si on utilise 4 disques en parallèle, on aurait un débit total théorique égal à quatre fois le débit de chaque disque, soit quasiment 1Go/s. Mais la contrepartie, c’est que tous les disques du volume doivent être consultés pour lire un fichier. Si un disque est défaillant, alors plus aucun fichier ne peut être lu. Le volume est corrompu, c’est à dire illisible. Evidemment c’est insupportable et c’est pour ça que des méthodes RAID ont été développées.

Dans un système RAID, toutes les données de tous les fichiers sont réparties sur tous les disques.

RAID. Je vous laisse déduire duquel on parle
Je vous laisse déduire duquel on parle

Disque de redondance : ce qu’il fait, ce qu’il ne fait pas

De manière à être robuste à la perte d’un (ou plusieurs disques), le système RAID va jouer sur :

1/ la façon dont il réparti les données d’un fichier sur les différents disques

2/ le calcul et l’enregistrement de données supplémentaires (« l’empreinte numérique du fichier »)

Cette empreinte lui permettra de détecter si les données lues sont cohérentes. Le cas échéant, il vous en alertera (corruption de données), et vous proposera quand il le peut de corriger la donnée en défaut.

Dans le cas d’une panne d’un disque, le système RAID sera en mesure grâce à cette empreinte de déterminer quelle était l’information enregistrée sur le disque défaillant. De fait, les fichiers pourront continuer à être consultés. Et après remplacement du disque en cause par un disque neuf, le système RAID pourra recréer complètement le contenu de ce disque. Ca s’appelle une « reconstruction » et vous n’aurez rien à faire. Pour comprendre comment cela est possible, je vous renvoie à l’explication que j’en ai faite dans la vidéo ci-dessous.

Ces empreintes de fichier utilisent une place supplémentaire. Comme expliqué dans la vidéo, pour être robuste à la perte d’un disque il faut au moins un disque dédié à ces empreintes. C’est ce que j’appelle le disque de redondance ou disque de parité. Par extension, il faudra deux disques de redondance pour être robustes à la perte de deux disques. En conséquence, sur un volume RAID, la capacité utile sera forcément inférieure à la capacité totale des disques.

J’en profite par ailleurs pour clarifier une fausse idée qu’on peut se faire (je l’ai fait à mes débuts) sur le disque de redondance : il ne constitue en rien une sauvegarde de vos fichiers.

Dans un système RAID, le disque de redondance ne constitue pas une sauvegarde de vos données
Il s’agit uniquement d’apporter une robustesse au sein d’un volume
Une sauvegarde est une copie d’un volume vers un autre volume.

Les types de RAID

Les types de RAID les plus connus sont :

  • RAID0, qui n’est pas tolérant à la panne d’un disque, nous n’en parlerons donc pas plus ici. C’est zéro.
  • RAID1, pour des volumes de deux disques, un disque est le miroir de l’autre. C’est le plus simple.
  • RAID10, pour des volumes de disques en nombre pair, chaque paire fonctionnant en RAID1. C’est le plus rapide.
  • RAID5, pour des volumes de trois disques et plus, un disque étant dédié à la redondance. C’est le meilleur compromis.
  • RAID6, pour des volumes de quatre disques et plus, deux disques étant dédiés à la redondance. C’est le plus sûr.

Je vous laisse suivre les liens pour une explication détaillée.

Profitons juste de la discussion pour revenir sur le cas du disque de redondance. Dans le cas du RAID1, son rôle est très facile à comprendre : il s’agit d’un miroir parfait de l’autre disque. On pourrait donc penser que c’est une copie locale, mais en fait pas du tout. D’abord car c’est un miroir à tout instant. Donc si vous supprimez un ficher, les données disparaitront en même temps sur les deux disques. Ensuite, cette mécanique est transparente pour l’utilisateur qui ne peut pas accéder aux données du disque 1 plutôt qu’à celles du disque 2. La notion d’accès à un support physique disparait complètement, on n’interagit qu’avec un volume logique.

Ce qu’il faut absolument retenir c’est que pour ces méthodes (à part RAID0),

  • La capacité utile de stockage est inférieure à la somme des capacités des disques.
  • Le ou les disques de redondance ne constituent pas une sauvegarde de vos données. Uniquement la capacité de conserver l’intégrité du volume en cas de panne d’un disque.
  • Les disques doivent être de même capacité. Sinon, les disques seront tous considérés d’une capacité égale au plus petit disque du volume.

A savoir que des constructeurs comme Synology ont développé des méthodes propriétaires appelées SHR (Synology Hybrid RAID) ou SHR2 qui contournent cette dernière limitation

TypeNb Disques
par Volume
Tolérance
à la panne
Capacité
Totale
Exemple avec des
disques de 10To
Cout pour C=12To
RAID121min(Ci)N=2, C=10To, V~500Mo/s550€
RAID102xN2N*min(Ci)N=4, C=20To, V~1Go/s760€
RAID5N≥31(N-1)*min(Ci)N=4, C=30To, V~750Mo/s570€
SHRN≥21ΣCi-max(Ci)N=4, C=30To, V<750Mo/s570€
RAID6N≥42(N-2)*min(Ci)N=4, C=20To, V~500Mo/s760€
SHR-2N≥32ΣCi-max1(Ci)-max2(Ci)N=4, C=20To, V<500Mo/s760€
Comparaison des performances des différents types de RAID
Ci est la capacité de chaque disque
V est le débit de lecture d’un disque

Si vous n’êtes pas trop porté sur les formules, je vous laisse jouer avec le calculateur de RAID de Synology . Il permet de comparer visuellement les différentes solutions sur des exemples concrets. Et pour la version courte, retenez que vous serez en RAID1 sur un NAS 2-baies. Pour plus que 2 bais, le meilleur choix sont les RAID5/SHR, car ce sont ceux qui offrent le meilleur rapport performance*capacité/coût.

Comparateur de RAID sur le site Synology

Bien choisir / construire son NAS

Vous l’aurez compris des paragraphes précédents, pour un besoin donné en termes de capacités, il existe une grande variété de NAS/RAID qui permettent d’y répondre. Par exemple si mon besoin est de 12To, je peux choisir parmi les options suivantes:

ConfigType RAIDCapacité d’expansionCoût au To
NAS 2-baies avec 2 disques de 12ToRAID1Besoin de remplacement des deux disques70€
NAS 4-baies avec 4 disques de 4ToRAID5/SHRBesoin de remplacement d’au moins deux disques82€
NAS 4-baies avec 3 disques de 6ToRAID5/SHRCapacité de rajouter un disque de 6To dans la 4e baie89€
NAS 4-baies avec 4 disques de 6ToRAID6/SHR-2Besoin de remplacement d’au moins trois disques105€
Quatre configurations pour une même capacité utile de 12To

On constatera que ces quatre options arrivent à des tarifs bien différents, mais présentent également des limitations différentes. La 4e est la plus chère et la plus « safe » (tolère deux pannes, mais ce qui est un peu excessif pour un cadre d’utilisation personnel). Les deux premières sont les moins chères mais vous serez bien embêté le jour où vous aurez rempli vos 12To. La troisième solution, pour un tarif qui semble plus élevé, vous permettra à terme de monter à 18To très facilement pour un coût final de 70€/To.

Pour ces raisons, je conseillerais vivement de toujours laisser une baie vide quand vous achetez un NAS. Même si cela peut sembler contre-intuitif, c’est votre meilleure assurance de conserver votre NAS longtemps sans être bloqué par la capacité dans le futur.

Le système SHR (exclusif à Synology) est aussi très pratique pour nous autres amateurs car il est le plus souple en terme d’évolutivité. Ainsi vous ne serez pas limité à une capacité unique pour tous les disques d’un volume. Si vous avez 4 baies peuplées avec des disques 8To, vous pourrez en remplacer deux ou trois dans un an par des 16To par exemple. Ainsi il est possible d’augmenter la capacité de votre volume à nombre de disques fixe (ce qui ne serait pas possible avec du RAID5, où il faudrait tous les remplacer). Et tout ça sans jamais éteindre le NAS ni faire d’opérations manuelles sur les fichiers.

NAS bi-volumes ou deux NAS

Dans le paragraphe précédent, nous nous sommes finalement arrétés à la première étape de notre stratégie de stockage : l’hébergement des originaux. Mais il ne faut pas s’arrêter en si bon chemin, et réfléchir à la suite : la copie locale. Dès lors, deux options se présentent :

  • Tout simplement doubler l’achat initial, avec un deuxième NAS identique au premier et peuplé avec les mêmes disques
  • Ou alors acheter un NAS avec deux fois plus de baies, dans lequel on créera deux volumes

Dans le premier cas, on aura une redondance totale et la capacité de localiser le second NAS dans un tout autre endroit que le premier. Dans une pièce différente, dans le garage, là où c’est pratique pour vous. Vous réduirez ainsi l’impact d’un incendie, dégât des eaux, cambriolage.

A l’inverse, avoir deux volumes dans un même NAS vous expose à des modes communs de défaillance, mais ça prend moins de place. Ou tout simplement, vous n’avez pas forcément le réseau dans toutes les pièces de votre logement. C’est donc un choix personnel lié à la configuration de votre logement et à votre budget.

Quoi qu’il en soit, dans les deux cas on a deux volumes logiques. Il sera alors aisé de mettre en place une routine qui duplique les données du premier volume sur le second, assurant ainsi la copie locale. On pourra aussi définir une politique de rétention pour archiver les N dernières versions d’un même fichier. Vous serez de cette manière capable de revenir à la version d’un fichier qui vous intéresse.

Quelles interfaces ?

Un NAS ne se connecte pas en USB directement à votre PC comme un disque externe. C’est un ordinateur à part entière qui communique avec les autres éléments de votre installation via le réseau Ethernet. Les réseaux les plus communs chez les particuliers sont dits « 1GbE », c’est à dire avec un débit de ~110Mo/s. C’est moins qu’un port USB3 et c’est clairement ça qui fera la vitesse de communication avec le NAS plutôt que le débit des disques qui va aisément atteindre cette valeur. Certains NAS sont vendus avec des prises 2.5GbE ou 10GbE, qui ont des débits théoriques respectifs de 250Mo/s et ~1Go/s. Dans ce cas c’est bien les disques qui deviendront l’élément limitant. Il vaudra alors mieux privilégier des volumes utilisant 4 disques ou plus pour tirer pleinement profiter du débit du réseau Ethernet.

A noter qu’il faudra aussi que votre PC/Mac ait une interface du même type pour que cela fonctionne. Et si vous avez un switch ou une box entre les deux dans votre réseau, il faudra également qu’ils soient sur la même norme Ethernet. Sinon la vitesse du réseau sera celle de son maillon le moins performant. Je reviendrai sur les aspects réseaux plus en détail dans un article dédié.

Conclusions de la troisième partie

Il est important de bien comprendre comment fonctionne un NAS et les principes de base des méthodes RAID avant de choisir son NAS.

  • Un des disques sera utilisé comme disque de redondance.
  • La capacité utile de stockage est de fait inférieure à la somme de la capacité des disques. Pour autant c’est cela qui fait que le NAS est un outil bien mieux adapté au travail de sauvegarde qu’un disque externe.
  • Le format de RAID le plus adapté sera le RAID5 voire SHR si vous achetez Synology.
  • Le débit de lecture sera probablement limité par le réseau.

Consulter la dernière partie de cette série d’article >>> Le stockage 4/4

Le stockage 2/4 <<<< Consulter la première partie de cette série d’articles

A propos de l'auteur:


4 commentaires:


Leave a Comment!

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *