NetApp Tech OnTap

Réflexions sur les systèmes de stockage haute capacité

La croissance rapide de la taille des disques a rendu possible la configuration de systèmes de stockage individuels avec un échelonnement des capacités de stockage. Prenez par exemple un FAS6080 NetApp, ajoutez 1 176 lecteurs de disque SATA de 1 To, et vous arrivez à plus d’un pétaoctet (1 000 téraoctets) de capacité de stockage brut en un seul système.

Pour beaucoup de fournisseurs, les avantages des systèmes haute capacité sont des contraintes. Les lecteurs de grande taille vous offrent le meilleur prix au Go stocké. Plus de capacité à partir de moins d’axes signifie moins de disques et de systèmes de stockage à gérer, moins de consommation d'énergie et des besoins en refroidissement réduits, qui sont les principales préoccupations de la plupart des centres de données.

Alors, y a-t-il un inconvénient ? Pas vraiment, mais il y a des aspects important à prendre en considérations si l’on utilise des disques de grande taille. La capacité des disques a augmenté plus vite que leur qualité ou leurs performances. Il semble en effet que les nouveaux disques de plus grande taille présentent les mêmes risques de défaillance que les plus petits et que leurs performances restent identiques : La reconstruction d'un disque défaillant d'un To reviendrait à essayer de remplir une piscine avec un tuyau d’arrosage. Il faut vous préparer à patienter un certain temps pendant le processus de reconstruction intégrale.

Des reconstructions plus longues avec les disques SATA grande capacité ne signifient pas qu’il ne faut pas déployer de tels systèmes : Il vous suffit d'être attentif à leurs particularités et aux limites qu’ils imposent. Le présent article explique les problèmes auxquels il faut que vous pensiez lorsque vous étudiez un système haute capacité, entre autres :

  • les applications qui sont (et ne sont pas) adaptées à des systèmes haute capacité
  • la disponibilité des données
  • la protection des données
  • la reconstruction RAID
  • les nettoyages RAID et les scans d’arrière-plan des médias
  • le dimensionnement
  • la complexité des infrastructures

La majeure partie du débat concerne tous les systèmes de stockage haute capacité, mais je fournirai également au fur et à mesure, des détails concernant les systèmes haute capacité NetApp.

NetApp's FAS6040

Applications cibles

La première chose à comprendre concernant les systèmes de stockage haute capacité est qu’ils peuvent être limités par les caractéristiques des performances des lecteurs sous-jacents et qu’ils ne conviennent pas à toutes les applications. Sur le marché, les disques dont la capacité est la plus importante sont les disques SATA, plutôt que les disques hautes performances Fibre Channel. En dehors de la capacité, les SATA sont des disques modernes qui tournent à la même vitesse de rotation et fournissent le même débit. De plus, pour atteindre la taille souhaitée d’une unité de stockage donnée (système de fichiers, numéro d’unité logique etc.), vous allez déployer moins de disques, ce qui signifie généralement des performances maximales moindres de la part de l’unité de stockage.

Les systèmes de stockage et/ou les systèmes d’exploitation hôtes peuvent aussi imposer des limites de taille qui à leur tour, limitent le nombre d'axes que vous pouvez utiliser pour une unité de stockage donnée. Par exemple, Ext3, le système de fichiers par défaut de Linux®, a une taille maximale de 16 To ; aussi, en utilisant un disque de 1 To, un système de fichiers unique aurait une capacité limitée à 17 axes par exemple, en tenant compte de la capacité perdue lors des formatages, par exemple.

Lorsque vous pensez à aux systèmes haute capacité, vous devriez penser au stockage secondaire : ces systèmes ne sont pas nécessairement bien adaptés avec Exchange, aux bases de données ou à d’autres applications qui nécessitent des temps de réponse lents et des hauts débits. Les applications idéales comprennent :

  • la sauvegarde « disk-to-disk »
  • la cible pour la réplication de données (avec NetApp SnapMirror®, par exemple)
  • l’archivage d’e-mails
  • l’archivage de documents ou de fichiers
  • le stockage de mise en conformité

Le stockage secondaire se prête mieux à des applications à flux de données séquentielles importants, dont :

  • la capture d’images
  • la capture de vidéos en direct
  • les données sismiques

Disponibilité des données

En raison de l’existence possible de centaines d’axes SATA, il faut bien prendre en compte la disponibilité des données sur les systèmes haute capacité, y compris :

  • RAID
  • les configurations haute disponibilité
  • la haute disponibilité multi-emplacements

Les taux de défaillance des disques SATA sont en général plus élevés que ceux des disques Fibre Channel, ce qui rend la protection RAID délicate. NetApp recommande généralement d’utiliser le RAID 6 hautes performances à double parité (RAID-DP™) pour éviter toute perte de données pouvant survenir lors d’une double défaillance de disque dans un groupe de RAID. D’autres fournisseurs sont susceptibles d’offrir des solutions RAID 6 à double parité en fonction du produit de stockage. Sans tenir compte du fournisseur, tout système de stockage haute capacité bénéficiera constamment, avec RAID 6, de la solution avec la meilleure flexibilité de données.

Bien que les systèmes de stockage haute capacité soit plutôt utilisés comme stockage secondaire, les clients NetApp qui les ont déployés choisissent généralement des configurations complètes haute disponibilité, avec des contrôleurs actifs/actifs et sans points uniques de défaillance pour être sûrs que les stocks importants de données restent accessibles en permanence. Dans le cadre d’une solution haute disponibilité en haute capacité, il est important de bien étudier le temps nécessaire à un contrôleur pour récupérer les disques d’un autre contrôleur ou les restituer. Cela prendra peut-être un plus de temps si la solution comporte un nombre important de disques SATA par rapport à l'utilisation exclusive de disques Fibre Channel. Cela vient du fait que les disques SATA sont plus lents et que le processus de contrôle prend plus de temps qu’avec les lecteurs Fibre Channel.

Data ONTAP® 7.2.4 propose des solutions spécifiques optimisées pour la récupération et la restitution sur des disques SATA et peut améliorer les performances des systèmes SATA haute capacité en cas de redondance et de restitution, rivalisant ainsi avec les solutions utilisant uniquement des disques Fibre Channel. Pour bénéficier de ces solutions optimisées, nous recommandons l'utilisation de Data ONTAP 7.2.4 ou d'une version ultérieure pour toute solution de stockage NetApp haute disponibilité et haute capacité basée sur SATA.

Multipath HA est une des options de configuration de stockage NetApp qui a été sous-utilisée. Multipath HA vérifie qu’il existe bien deux chemins d’E/S séparés à partir de chaque contrôleur vers chaque disque, de façon à ce qu’aucun problème de câblage ou autre problème matériel n'interrompe l’accès aux lecteurs de disques. Dans les configurations haute disponibilité, de tels problèmes peuvent provoquer des redondances. Multipath HA réduit le risque de redondance en fournissant des chemins de données redondants à partir de chaque contrôleur vers son lieu de stockage. Multipath HA peut également contribuer à maintenir le niveau de performances en répartissant la charge de stockage entre les deux chemins d’accès aux données.

Protection des données

La sauvegarde des données à partir d’un système de stockage haute capacité constitue également un défi majeur. Les méthodes « disk-to-disk » sont privilégiées si possible pour réduire le temps de sauvegarde. Cependant, avec des outils tels que SnapVault® et SnapMirror de NetApp, le temps nécessaire à la création d’une copie de ligne de base d’un système de stockage haute capacité peut être trop important. NetApp propose deux outils : LREP (réplication logique) et SnapMirror to Tape pour assister la création de lignes de base qui pourront ensuite être transposées sur des systèmes distants. Par la suite, seuls les blocs modifiés sont répliqués, ce qui réduit l’impact sur les contrôleurs source et cible, ainsi que sur le réseau qui se trouve entre les deux.

Reconstruction RAID

De même que pour la plupart des autres activités de maintenance système, la reconstruction RAID s’étend aux lecteurs SATA de grande taille. Par exemple, si un disque de 1 To est défaillant, la reconstruction RAID sur un système NetApp prendra approximativement entre 10 et 12 heures en l’absence de toute autre charge. Cette durée sera prolongée si la charge sur le système augmente.

Les données concernant le temps moyen entre les défaillances laissent supposer que, sur un système de stockage équipé de lecteurs de disques 1 176 1TB, un système pourrait consacrer à la reconstruction 5 % du temps passé en conditions d'exploitation normales. Une fois encore, le pourcentage de temps passé à la reconstruction augmente lorsque la charge globale sur le système de stockage augmente.

Scan des médias et nettoyage RAID

Grâce à des scans des médias et des nettoyages réguliers du RAID, NetApp vérifie l’intégrité des données stockées, et je suppose que les autres fournisseurs de stockage fournissent le même type de fonctions de détection et de correction des problèmes. C’est comme si vous étiez en train de peindre un grand pont, lorsque vous démarrez à un bout et que vous peignez des mois durant jusqu'à l'autre bout et que vous recommencez ; ces deux utilitaires NetApp assurent simplement un suivi de leur progression et continuent à travailler via le sous-système de stockage jusqu’à ce que l’ensemble du stockage ait été contrôlé. Les scans d’arrière-plan des médias s’exécutent constamment à bas débit et se servent des diagnostics intégrés pour détecter les erreurs de médias. Les nettoyages du RAID s’exécutent par défaut sur une base hebdomadaire pendant six heures et utilisent les données de parité pour contrôler l’intégrité des données.

Sur les systèmes de stockage haute capacité, NetApp recommande d’augmenter le débit pour les scans de médias ainsi que la fréquence et la durée d’exécution des scans du RAID pour garantir que les données peu fréquemment utilisées (correspondant en général au stockage secondaire) seront contrôlées ponctuellement.

Dimensionnement du système de stockage

Lorsque le moment est venu de dimensionner un stockage haute capacité, il vous faut dans un premier temps définir les limites que vous impose le système de stockage (et le système d'exploitation hôte en environnement SAN) et prévoir en conséquence. Par exemple, sur les systèmes NetApp, vous pouvez définir jusqu’à 100 agrégats maximum, ou bien des volumes traditionnels sur un seul contrôleur de stockage, sachant que le nombre total d’agrégats, de volumes traditionnels et de volumes flexibles (volumes FlexVol®) ne peut dépasser 500. Par exemple, si votre système d’exploitation hôte limite vos systèmes de fichiers à 2 To, ou bien si vous avez en standard un nombre élevé de volumes FlexVol par agrégat, vous pourriez éventuellement rentrer dans la limite des 500 unités avant de dimensionner intégralement un système à sa capacité maximale.

Le fait est que, lorsque vous travaillez avec des systèmes haute capacité, vous ne pouvez pas vous mettre à dimensionner sans préparation. Il vous faut analyser les différentes limites de stockage et établir le planning préalable nécessaire pour vous assurer que vous êtes en mesure d’utiliser toute la capacité en laissant de la place pour les futurs besoins imprévus.

Complexité des infrastructures

Il y a un facteur à ne pas négliger lors de l'organisation du déploiement d'un système haute capacité : La véritable complexité de l’ensemble de l’infrastructure de disque. J'ai travaillé dernièrement avec un client qui avait 1 008 disques sur 72 rayonnages à disques. Ils étaient ensuite répartis dans 12 boucles de stockage à 6 rayons.

Dans un environnement actif/actif utilisant la connectivité de stockage de Multipath HA, chaque boucle de stockage nécessite 4 connexions, ce qui fait 48 connexions au total entre le stockage et le contrôleur de stockage, via de nombreuses armoires de stockage. Le câblage est réellement complexe. Vous ne pouvez tout simplement pas commencer à câbler un système de stockage de capacité maximale sans plan et vous attendre à un résultat correct. Le travail préalable est important pour s’assurer que tout fonctionne correctement une fois en place. Le planning préalable, la représentation schématique des câbles et l’étiquetage sont des points importants des déploiements de stockage haute capacité.

Conclusion

En étant attentif aux limites et aux contraintes potentielles, en réalisant une sélection réfléchie de vos applications, vous réussirez à déployer des systèmes de stockage en toute sécurité avec des capacités encore inconcevables il y a quelques années. Si vous examinez attentivement vos besoins en disponibilité et protection des données par rapport aux possibilités de capacité/débit des derniers lecteurs SATA et envisagez une étude préalable du dimensionnement et des contraintes physiques, vous pouvez éviter les désagréables surprises d'une solution à la va-vite et recueillir les bénéfices d'une gestion simplifiée, de coûts directs de stockage réduits, et de besoins réduits en énergie et en refroidissement

Chris Lueth Chris Lueth
Technical Marketing Engineer
NetApp

Chris a plus de 17 ans d’expérience dans l’industrie. Depuis son arrivée chez NetApp il y a cinq ans, il a incroyablement étoffé ses connaissances techniques en travaillant aux déploiements de NearStore®, sur RAID-DP, SnapLock®, sur les plates-formes de milieu de gamme et de pointe, et sur la flexibilité du stockage. Il était auparavant ingénieur-concepteur en électronique et a travaillé sur le premier circuit électronique de carte mère multiprocesseur, avant de passer à l’administration sous UNIX®, et finalement au stockage.

Commenter cet article
Explore