NetApp Logo
NetApp Tech OnTap
     

Jay White

Jay White
Ingénieur marketing technique
NetApp

PDF

Carlos Alvarez

Carlos Alvarez

Ingénieur marketing technique senior
NetApp

 


Cet article est le troisième volet d'une série intitulée « Retour aux notions de base », qui présente les fondamentaux des principales technologies NetApp®.

Avec l'augmentation constante de la taille des disques, il est de plus en plus difficile d'assurer la résilience qui permet de protéger les données stratégiques. En effet, bien que la taille des disques augmente, leur fiabilité globale n'a pas évolué. Une capacité de disque supérieure se traduit par une reconstruction nettement plus longue à l'aide des informations de parité Redundant Array of Independent Disks (RAID) en cas de panne. Ce qui expose le disque à une deuxième panne ou à une autre erreur le temps de la reconstruction. La probabilité d'erreurs de bit et de bloc augmente également en fonction de la taille du support, ce qui rend le risque d'autant plus réel pendant la reconstruction. En outre, ceci accroît le risque d'une double panne susceptible d'interrompre l'activité et d'entraîner la perte de données dans le cadre d'implémentations RAID à parité simple.

NetApp a été la première entreprise à développer une mise en œuvre RAID à double parité unique, RAID-DP®, pour résoudre ce problème de résilience. Il existe d'autres implémentations RAID 6 à double parité, mais RAID-DP est la seule à assurer une protection contre les doubles pannes de disque au sein du même groupe RAID sans baisse de performances notable.

Le RAID-DP est si efficace qu'il équipe par défaut les systèmes de stockage NetApp. Les tests montrent que la différence de performances de l'écriture aléatoire est seulement de 2 % par rapport à l'implémentation RAID 4 de NetApp. En comparaison, l'écriture aléatoire RAID 6 d'un autre grand fournisseur de stockage enregistre une baisse de performances de 33 % par rapport à un RAID 5 sur le même système. (Les configurations RAID 4 et RAID 5 sont toutes deux des implémentations RAID à parité simple.) La configuration RAID 4 utilise un disque de parité désigné. RAID 5 distribue les informations de parité à tous les disques du groupe RAID pour éviter qu'un disque de parité ne devienne un point sensible. Cette opération est inutile avec la configuration RAID 4 de NetApp compte tenu de la façon dont Data ONTAP® écrit les données, comme nous le verrons ultérieurement.

RAID-DP offre des avantages significatifs, parmi lesquels :

  • Protection maximale des données. Par rapport à une configuration RAID 5, le risque de perte de données en cas de double panne disque est des centaines de fois inférieur avec NetApp RAID-DP. Bien que RAID 1 + 0 offre une meilleure protection que le RAID 5, il présente néanmoins un risque de perte de données en cas de double panne de disques en miroir. RAID-DP offre une protection totale contre les doubles pannes de disques pour la moitié du prix d'une configuration RAID 1 + 0.

  • Coûts réduits. En général, les implémentations RAID 5 limitent la taille du groupe RAID à 3 + 1 ou 5 + 1 (ce qui entraîne des coûts supplémentaires de 17 à 25 %). RAID 1+0 requiert la configuration 1 + 1 (avec des coûts supplémentaires de 50 %). Par opposition, NetApp prend en charge les tailles de groupe RAID allant jusqu'à 28 (26 + 2) disques avec une capacité supérieure de 7 %.

  • Des performances sans compromis. Comme décrit précédemment, les technologies de double parité concurrentes peuvent considérablement affecter les performances d'écriture, mais elles peuvent être parfaites pour les applications qui exécutent essentiellement des opérations de lecture. La technologie NetApp RAID-DP n'affecte quasiment pas les performances, comparée à un RAID à parité simple. Elle constitue le choix par défaut de NetApp et convient à toutes les charges de travail.

  • Pas de frais de licence logicielle. Tous les systèmes NetApp sont équipés de la fonctionnalité RAID-DP en standard. Vous n'avez à prévoir aucun frais supplémentaire pour son utilisation, si ce n'est le coût de l'ajout de disques de parité, ce que vous pouvez compenser en utilisant des groupes RAID plus importants.

Ce chapitre de la série « Retour aux notions de base » décrit, entre autres, la mise en œuvre de la technologie NetApp RAID-DP, ses cas d'utilisation et les meilleures pratiques à suivre pour son implémentation.

Mise en œuvre de RAID-DP dans Data ONTAP

Intégration totale à NVRAM et WAFL

L'implémentation RAID-DP dans Data ONTAP est étroitement liée aux systèmes NVRAM et WAFL® (Write Anywhere File Layout) de NetApp. C'est la solution miracle pour des performances exceptionnelles avec une implémentation RAID-DP comparée à une implémentation RAID 6.

Écrire dans la mémoire étant plus rapide qu'écrire sur un disque, les fournisseurs de systèmes de stockage utilisent généralement une mémoire RAM non volatile (NVRAM) à batterie intégrée pour mettre les écritures en cache et accélérer les performances. NetApp intègre une mémoire NVRAM à tous ces systèmes de stockage, mais l'environnement d'exploitation NetApp Data ONTAP utilise une mémoire NVRAM de manière très différente de celle des baies de stockage types.

La mémoire NVRAM est utilisée comme un journal des demandes d'écriture reçues par Data ONTAP depuis le dernier point de cohérence. À intervalles de quelques secondes, Data ONTAP crée une copie Snapshot™ spéciale appelée point de cohérence, qui est une image parfaitement cohérente du système de fichiers sur disque. Un point de cohérence reste inchangé, y compris lorsque de nouveaux blocs sont écrits sur le disque, car Data ONTAP ne remplace jamais les blocs de disque existants. Avec cette approche, si une panne se produit, Data ONTAP revient simplement au dernier point de cohérence, puis relit le journal des demandes d'écritures de la mémoire NVRAM.

L'utilisation de la NVRAM est très différente de celle des baies de stockage traditionnelles. En effet, avec ces dernières, les demandes d'écriture sont mises en cache au niveau de la couche du disque. La NVRAM offre plusieurs avantages, dont la réduction de la capacité de NVRAM requise, ce qui améliore le temps de réponse pour l'auteur et optimise les écritures sur le disque.

Optimisation des écritures : RAID 4

Cette approche de mise en cache des écritures est étroitement intégrée aux implémentations NetApp RAID et permet à NetApp de planifier les écritures de manière à optimiser les performances d'écriture du disque pour la baie RAID sous-jacente. Nous commencerons par expliquer comment NetApp optimise ce processus pour son implémentation RAID 4 avant d'aborder la configuration RAID-DP.

Les baies RAID gèrent les données en bandes, une bande étant composée d'un bloc issu de chacun des disques d'un groupe RAID. Un bloc est désigné comme bloc de parité pour chacune des bandes. La figure 1 présente un groupe RAID 4 classique utilisant une parité horizontale qui se compose de quatre disques de données (quatre premières colonnes intitulées D) et un disque à parité simple (dernière colonne intitulée P).

Figure 1) Exemple de parité RAID 4

Example of RAID 4 parity.

Dans cet exemple, la parité a été calculée en additionnant les valeurs de chaque bande horizontale, puis en conservant la somme comme valeur de parité (3 + 1 + 2 + 3 = 9) à des fins de démonstration. En pratique, la parité est calculée grâce à une opération OU exclusive (XOR).

S'il est nécessaire de reconstruire les données suite à une panne unique, le processus de génération de la parité est simplement inversé. Par exemple, si le premier disque tombe en panne, l'implémentation RAID 4 recalcule les données de chaque bloc de disque 1 à partir des données restantes. Dans notre exemple, cette opération est réalisée en soustrayant les valeurs des disques restants de la valeur stockée en parité (9 – 3 – 2 – 1 = 3). Cela explique également pourquoi un RAID à parité simple protège seulement contre les pannes de disque uniques. Vous pouvez constater que si deux valeurs sont manquantes, les informations disponibles sont insuffisantes pour recalculer les valeurs qui manquent.

Dans les implémentations RAID types, pour écrire de nouvelles données dans une bande qui contient déjà des données (et une parité), vous devez lire le bloc de parité et calculer une nouvelle valeur de parité pour la bande avant d'écrire le bloc de données et le nouveau bloc de parité. Cette opération nécessite un temps considérable pour chaque bloc à écrire.

NetApp limite ce contretemps en mettant les écritures en mémoire tampon (protégées par le journal de la NVRAM), puis en écrivant les bandes RAID complètes et la parité dès que possible. La lecture des données de parité avant leur écriture est donc inutile, ce qui permet à la technologie WAFL d'effectuer un calcul de parité simple pour une bande complète des blocs de données. (Le nombre exact de blocs dépend de la taille du groupe RAID.) Ceci est possible car la technologie WAFL ne remplace jamais de blocs existants lorsqu'ils sont modifiés et parce que cette technologie permet d'écrire des données et des métadonnées (informations de comptabilisation décrivant l'organisation des données) à n'importe quel emplacement. Sur les autres couches de données, les blocs de données modifiés sont généralement remplacés et les métadonnées doivent souvent se trouver à des emplacements fixes.

Ajout de la parité diagonale : RAID-DP

NetApp RAID-DP utilise deux disques de parité par groupe RAID. Un premier disque de parité stocke la parité calculée pour les bandes horizontales, comme décrit précédemment. Un deuxième disque stocke la parité calculée à partir des bandes diagonales. Dans la figure 2, une bande de parité diagonale (blocs en bleu) et un deuxième disque de parité (intitulé DP) ont été ajoutés à la parité horizontale de la figure 1.

Figure 2) Ajout de parité diagonale

The addition of diagonal parity.

La bande de parité diagonale inclut dans son calcul un bloc provenant du disque de parité horizontale. RAID-DP traite de la même façon tous les disques de la construction RAID 4 initiale, y compris les disques de données et de parité. Notez qu'un disque a été omis de la bande de parité diagonale. La figure 3 contient des bandes de parité horizontale et diagonale supplémentaires.

Figure 3) Plusieurs bandes présentant la parité horizontale et diagonale

Multiple stripes showing both horizontal and diagonal parity.

Il manque un seul disque à chaque bande de parité diagonale et un disque différent à chaque diagonale. On remarque également une bande diagonale (blocs blancs sur la figure 3) qui ne possède pas de parité stockée sur le disque de parité diagonale : cela n'affecte en rien la capacité à récupérer toutes les données.

Restauration après une double panne disque

La combinaison parité horizontale/parité diagonale permet d'effectuer une restauration après deux pannes de disque au sein d'un même groupe RAID. Si un seul disque est défaillant ou si une erreur de bloc ou de bit se produit, seule la parité horizontale est requise pour recréer les données manquantes.

Après une double panne disque, RAID-DP identifie d'abord une chaîne sur laquelle commencer la reconstruction, comme indiqué sur la figure 4. Souvenez-vous que la reconstruction des données à partir de la parité est possible si et seulement s'il ne manque pas plus d'un élément. C'est pourquoi chaque bande de parité diagonale ignore l'un des disques de données.

Figure 4) Début de la restauration RAID-DP à partir de la parité diagonale

Start of RAID-DP recovery using diagonal parity.

La restauration du premier bloc au moyen de la parité diagonale permet de restaurer un deuxième bloc à l'aide de la parité horizontale (première ligne de la figure 4). Cette opération donne ensuite la possibilité de restaurer un autre bloc manquant grâce à la parité diagonale. Cette chaîne de restauration se poursuit jusqu'à atteindre la bande pour laquelle il n'existe pas de parité diagonale. À ce stade, un autre point d'entrée est trouvé et la restauration d'une autre chaîne de bandes diagonales et horizontales commence. Une fois l'opération terminée, suffisamment de blocs manquants sont remplis de sorte que toutes les valeurs de la bande sans parité puissent être recalculées avec la parité horizontale uniquement. Ce processus est illustré plus en détail dans le rapport technique TR-3298 : RAID-DP.

Nous avons ici simplifié les exemples afin de rendre plus clairs les concepts de base de la configuration RAID-DP. Cependant, il est essentiel de comprendre que les mêmes processus s'appliquent aux déploiements de stockage réels qui comptent des dizaines de disques par groupe RAID et des millions de lignes de données. Dans cet exemple de panne, la restauration concerne deux disques de données adjacents, mais le processus fonctionne que les disques soient adjacents ou non, et que les disques défaillants soient des disques de données ou des disques de parité.

Optimisation des écritures : RAID-DP

Comme nous l'avons vu au cours de la discussion précédente sur le RAID 4, la technologie WAFL essaie toujours de mettre en tampon et d'écrire des bandes de blocs complètes sur le disque. Le RAID-DP met en mémoire tampon les blocs de données pour effectuer plusieurs calculs de parité horizontale et diagonale en une seule opération de lecture. La diminution des performances de 2 % du RAID-DP par rapport au RAID 4 est due à la charge supplémentaire que représentent le calcul de la parité diagonale et l'écriture du deuxième bloc de parité.

Cas d'utilisation

Concernant les cas d'utilisation de RAID-DP, cette technologie est tellement répandue dans les stockages NetApp, qu'il est plus simple de parler des situations dans lesquelles vous êtes susceptible de choisir de ne pas l'utiliser. Plus de 90 % des clients de NetApp font déjà appel au RAID-DP, y compris pour les charges de travail stratégiques du point de vue des activités et des performances. RAID-DP est la technologie par défaut pour tous les nouveaux systèmes de stockage NetApp. Nous préconisons le RAID-DP dans nos meilleures pratiques et nous l'utilisons dans nos tests de performances publiés. Tous les logiciels NetApp sont entièrement compatibles avec RAID-DP. Aucun autre fournisseur ne peut en dire autant concernant son implémentation RAID 6.

Les rares situations dans lesquelles la résilience n'est pas essentielle (par exemple pour les espaces de travail, les tests et les environnements de laboratoire) sont les seuls cas où vous pourriez être susceptible de choisir le RAID 4 au lieu du RAID-DP.

Utilisation de la technologie RAID-DP

La technologie RAID-DP a été introduite dans la version 6.5 de Data ONTAP.

Création de volumes RAID-DP

Pour créer un agrégat (ou volume traditionnel) avec des groupes RAID-DP, sélectionnez l'option correspondante lors du provisionnement du stockage avec les outils graphiques NetApp ou ajoutez l'argument –t raid_dp aux commandes aggr create ou vol create.

Si le type RAID n'est pas spécifié, Data ONTAP utilise automatiquement le type RAID par défaut, qui est RAID-DP pour toutes les versions Data ONTAP actuellement commercialisées. Pour connaître l'option par défaut pour votre système, sélectionnez votre version de Data ONTAP dans la bibliothèque d'informations Data ONTAP. (Accès NetApp NOW® requis.)

                                                                             
Data ONTAP 8.0.1 - Taille de groupe RAID par défaut et maximale, par type de disque
Type de disque
Type de RAID
Taille du groupe RAID par défaut
Taille maximale du groupe RAID
SSD
RAID-DP (valeur par défaut)
23 (21 + 2)
28 (26 + 2)
RAID 4
8 (7 + 1)
14 (13 + 1)
SAS/FC
RAID-DP (par défaut)
16 (14 + 2)
28 (26 + 2)
RAID 4
8 (7 + 1)
14 (13 + 1)
SATA
RAID-DP (par défaut)
14 (12 + 2)
20 (18 + 2)
RAID 4
7 (6 + 1)
7 (6 + 1)

Les groupes RAID 4 existants peuvent être transformés en groupes RAID-DP. La conversion se produit au niveau de l'agrégat, ou volume traditionnel. Un disque (au moins de même capacité que le disque du groupe RAID) doit être disponible pour la parité diagonale de chaque groupe RAID.

Choix de la taille du groupe RAID-DP

La possibilité d'utiliser un groupe RAID de taille supérieure avec la technologie RAID-DP peut permettre de compenser l'impact sur la capacité utilisable du disque supplémentaire requis pour la parité. Pour réduire, voire supprimer, cet impact, une solution consiste à utiliser la taille de groupe RAID-DP par défaut pour votre type de disque. Créez des agrégats basés sur des multiples de la taille du groupe RAID-DP par défaut.

Pour les disques durs (SATA, FC et SAS), l'approche privilégiée consiste à définir une taille de groupe RAID comprise entre 12 (10 + 2) et 20 (18 + 2) et permettant d'obtenir une disposition de groupes RAID homogène (tous les groupes RAID contenant le même nombre de disques). Si plusieurs tailles de groupes RAID permettent d'obtenir une disposition homogène, il est conseillé d'utiliser la taille de groupe RAID la plus grande. L'utilisation de groupes RAID incomplets est parfois inévitable. Dans ce cas, l'agrégat doit comporter un nombre de disques qui soit au moins égal au nombre de groupes RAID moins un (sinon, il est préférable de choisir la taille de groupe RAID inférieure). Les disques manquants doivent alors être répartis de façon égale entre les groupes RAID de sorte qu'il ne manque pas plus d'un disque sur chacun des groupes RAID.

Gestion du RAID-DP

Dans le cas d'une configuration RAID-DP, les modifications à apporter à vos modes opératoires sont minimes voire inexistantes. Un système de stockage peut contenir à la fois des agrégats et des volumes RAID 4 et RAID-DP, et les commandes que vous utilisez pour la gestion restent les mêmes.

Reconstruction RAID-DP

En cas de double panne de disque, RAID-DP augmente automatiquement la priorité du processus de reconstruction de sorte que la restauration se termine plus rapidement. Par conséquent, la reconstruction des données à partir de deux disques défaillants est légèrement plus rapide que la reconstruction de données suite à une panne sur un seul disque. En cas de double panne de disque, il est fort probable qu'un disque tombe en panne quelque temps avant le deuxième et que certaines informations aient déjà été recréées à l'aide de la parité horizontale. RAID-DP s'adapte automatiquement à ce phénomène en commençant la restauration là où deux éléments sont manquants à partir de la panne du deuxième disque.

Data ONTAP comprend des options qui permettent à l'administrateur de stockage d'ajuster l'impact de la reconstruction RAID sur les performances du système.

L'option raid.reconstruct.perf_impact est définie par défaut sur « moyen ». Les trois valeurs possibles sont faible, moyen et élevé. Un impact faible peut accroître la durée de la reconstruction RAID puisque les ressources système sont mobilisées pour répondre aux E/S prioritaires. Un impact élevé permettra aux opérations de restauration RAID de rivaliser avec les E/S prioritaires pour des ressources système accrues (réduisant ainsi les performances d'E/S prioritaires).

Certaines situations peuvent justifier de modifier cette option, mais en dernier recours uniquement. NetApp conseille généralement de conserver la valeur par défaut.

Pour plus d'informations sur la gestion RAID-DP, reportez-vous aux sections appropriées du TR-3437 : Guide de résilience du sous-système de stockage.

Conclusion

La technologie NetApp RAID-DP est un outil de résilience essentiel, compatible avec quasiment toute charge de travail de stockage courante. Pour en savoir plus sur NetApp RAID-DP, reportez-vous aux documents NetApp TR-3298 : Implémentation de RAID-DP pour la protection des données et WP-7005 : Protection RAID-DP 6 double parité sans compromis.

>Vous avez des commentaires sur la technologie RAID-DP ?

Jay White est ingénieur marketing technique pour la résilience des systèmes, les sous-systèmes de stockage (tiroirs disques, disques, etc.) et la technologie RAID. Il est l'auteur de plusieurs rapports techniques et FAQ relatifs à la configuration et à la résilience des sous-systèmes de stockage.

Carlos Alvarez travaille pour NetApp depuis 2008. Il est spécialiste de l'efficacité de stockage et a une grande expérience de la déduplication, de la compression des données et du provisionnement fin. Ses conseils ont aidé de nombreux clients à optimiser l'efficacité de leur stockage en intégrant efficacement les technologies NetApp à leur configuration.

Explore
Explorer

Autres articles Retour aux notions de base

Découvrez les notions de base des principales technologies NetApp. Les articles suivants sont d'ores et déjà disponibles :