NetApp Tech OnTap Logo NetApp
NetApp Tech OnTap
     
Automated Storage Tiering
et NetApp Virtual Storage Tier

Les technologies Automated Storage Tiering (AST) ont pour principal objectif d'aider les data centers à tirer parti des performances supérieures des supports Flash, tout en minimisant les coûts et la complexité. Les périphériques Flash, tels que ceux basés sur les contrôleurs SSD (Solid State Disk), peuvent effectuer 25 à 100 fois plus d'opérations de lecture aléatoire par seconde que les disques durs les plus rapides. Cependant, ces performances ont un coût par gigaoctet 15 à 20 fois plus élevé. Bien que les disques durs ne cessent de gagner en capacité, leurs performances en termes d'opérations d'E/S par seconde et par dollar ne progressent guère. Les supports Flash sont beaucoup plus intéressants sur ce plan et offrent en outre une latence moins importante.

Gamme FAS6200

Figure 1) Comparaison de l'efficacité de la lecture aléatoire des différents types de supports rotatifs et SSD sur une échelle logarithmique. Notez que le niveau d'opérations d'E/S par seconde et par dollar est relativement similaire entre les différents types de disques durs.

Plutôt que de placer de manière définitive un jeu de données entier sur un support onéreux, les technologies AST identifient les données fréquemment utilisées, qu'elles stockent sur des supports hautes performances, et enregistrent les autres sur des supports économiques plus lents.

NetApp a investi beaucoup de temps et d'énergie dans le but de comprendre les problèmes que ces technologies doivent résoudre pour pouvoir offrir une solution optimale.

Cet article aborde les sujets suivants :

  • Critères d'évaluation des technologies AST
  • Comparaison des approches AST basées sur la migration et sur la mise en cache
  • NetApp® Virtual Storage Tier (approche AST basée sur la mise en cache)

Évaluation des technologies AST

En termes d'E/S, le premier objectif des technologies AST est de faire passer autant d'E/S aléatoires que possible sur des supports hautes performances (Flash) de manière à minimiser la charge d'E/S aléatoires sur le disque dur et à réduire la latence moyenne. La distinction entre E/S aléatoires et E/S séquentielles est importante, car le rapport prix/performances des supports Flash en matière de lectures et écritures séquentielles n'est guère meilleur que celui des disques durs (lesquels sont particulièrement efficaces dans ce domaine).

Gamme FAS6200

Figure 2) Comparaison de l'efficacité du débit séquentiel des différents types de supports rotatifs et SSD.

Plusieurs facteurs peuvent affecter la capacité d'une solution AST à atteindre l'objectif ci-dessus :

  • Granularité du placement de données : plus la taille des blocs de données que vous manipulez est réduite, plus leur stockage est efficace en termes d'utilisation des ressources du système et du disque dur. Vous risquez donc moins de placer des données peu consultées avec des données fréquemment utilisées, ce qui minimise l'encombrement inutile des supports onéreux.
  • Mode d'identification et rapidité de stockage des données fréquemment utilisées : la rapidité avec laquelle les données fréquemment utilisées sont transférées sur le support Flash a un impact non seulement sur la gestion des pics d'E/S transitoires, mais aussi sur le nombre d'E/S requises au niveau du disque dur et sur la latence moyenne.

D'un point de vue opérationnel, il convient de prendre en compte plusieurs facteurs supplémentaires :

Difficulté de déploiement et de gestion de la solution : une solution AST dont le déploiement nécessite une importante reconfiguration ou dont l'exécution exige de nombreux efforts de surveillance ou de gestion, irait à l'encontre du but recherché.

Intégration de la solution aux autres technologies de stockage existantes (sauvegarde, déduplication, provisionnement fin, etc.) : rien n'est plus désagréable que de déployer une solution pour s'apercevoir ensuite que les sauvegardes ne fonctionnent plus ou qu'elles entraînent des transferts de données massifs.

Approche AST : migration ou mise en cache ?

Deux grandes approches existent en matière de technologies AST : la migration et la mise en cache.

Les solutions AST basées sur la migration automatisent le processus de migration des données. Les blocs de données identifiés comme fréquemment utilisés sont transférés vers des supports rapides, puis déplacés vers des supports plus lents lorsqu'ils sont moins sollicités. Qu'ils s'effectuent en provenance ou en direction du support Flash, ces transferts nécessitent toujours un accès au disque dur.

Les solutions AST basées sur la mise en cache se servent de méthodes de mise en cache bien connues pour « promouvoir » le déplacement des données fréquemment utilisées vers les supports hautes performances. Comme une copie des données est conservée sur le disque dur, il est ensuite possible (lorsque leur utilisation diminue) de les supprimer du cache sans générer d'opération d'E/S supplémentaire sur le disque dur.

Gamme FAS6200

Figure 3) Répartition AST : comparaison des approches basées sur la mise en cache et sur la migration.

NetApp Virtual Storage Tier

Après avoir évalué ces deux approches AST à l'aide des critères précédents, NetApp a conclu que la stratégie de mise en cache fournissait de meilleurs résultats.

NetApp a par ailleurs pu se concentrer sur l'optimisation des performances de lecture, puisque le système NetApp Write Anywhere File Layout (WAFL®) transforme avec efficacité les opérations d'écriture en écritures séquentielles, lesquelles sont prises en charge par les disques durs (voir Figure 2). Vous trouverez plus d'informations à ce sujet dans un bulletin de blog publié récemment par Mike Riley et John Fullbright, qui collabore à Tech OnTap® (c'est d'ailleurs la raison pour laquelle la technologie RAID double parité de NetApp, RAID-DP®, affiche de meilleures performances d'écriture que les implémentations RAID 6).

Gamme FAS6200

Figure 4) NetApp Virtual Storage Tier : une approche AST basée sur la mise en cache.

NetApp Virtual Storage Tier favorise la mise en cache des données fréquemment utilisées, tout en minimisant les E/S sur le disque dur. Lors de la réception d'une requête de lecture relative à un bloc situé sur un volume ou une LUN, ce bloc est automatiquement promu. La promotion d'un bloc de données est un processus différent de la migration, dans la mesure où le bloc reste sur le disque dur pendant qu'il est copié sur Virtual Storage Tier. L'opération est directement effectuée à partir du cache du tampon système. Elle ne nécessite donc aucune E/S de disque supplémentaire.

De même, comme la promotion des blocs de données a lieu immédiatement après la première lecture du disque dur, elle ne requiert aucune E/S supplémentaire au niveau du disque. Par comparaison, dans la plupart des implémentations AST basées sur la migration, la promotion des données fréquemment utilisées n'a lieu qu'après de multiples lectures depuis le disque dur ou au moment de la prochaine migration planifiée. Le processus de migration nécessite alors de nouvelles E/S de disque.

Les algorithmes NetApp distinguent les données stratégiques des autres données et les conservent dans Virtual Storage Tier. Les métadonnées, par exemple, sont toujours promues à la première lecture. Les lectures séquentielles, en revanche, ne sont généralement pas mises en cache dans Virtual Storage Tier (sauf configuration contraire), car elles tendent à occulter les données plus importantes et sont en outre parfaitement prises en charge par les disques durs. Vous pouvez modifier ce mode de fonctionnement afin de satisfaire les besoins des applications qui possèdent un comportement d'accès aux données unique ou des exigences de niveau de service spécifiques.

Avantages de Virtual Storage Tier

Promotion en temps réel des données fréquemment utilisées avec granularité élevée. En général, le déplacement d'un bloc de données vers Virtual Storage Tier a lieu lors de sa première lecture à partir du disque. Sur le plan des performances, les avantages sont visibles en temps réel, puisque toutes les lectures suivantes sont effectuées à partir de Virtual Storage Tier. Ce dernier identifie des modèles de comportement de lecture et lit de manière anticipée les blocs de données susceptibles d'être utilisés. Cependant, il n'entraîne aucun transfert de données massif entre les niveaux de stockage, ce qui minimise les E/S sur le disque dur et le recours aux autres ressources système. Associée à une granularité fine, qui permet la manipulation de blocs individuels de 4 Ko, cette approche efficace assure la promotion des données fréquemment utilisées en temps réel.

Dans le cadre des solutions AST basées sur la migration, la migration des données fréquemment utilisées entre les différents niveaux de stockage a lieu en arrière-plan ou est planifiée pendant les heures creuses (pour réduire l'impact sur le système de stockage). Ces solutions offrent une granularité au moins 128 fois plus élevée que Virtual Storage Tier (entre 0,5 Mo et 1 Go, voire l'intégralité d'un volume ou d'une LUN). Le transfert des données peut donc être particulièrement long. Elles peuvent ne pas tenir compte de pics d'activité importants, si la durée de ces pics est inférieure au délai requis pour identifier et promouvoir les données fréquemment utilisées.

Avec une granularité de 4 Ko, Virtual Storage Tier optimise l'utilisation des supports Flash. À l'inverse, les solutions dotées d'une granularité moins fine déplacent souvent de nombreuses données peu consultées avec les blocs de données fréquemment utilisées, si bien qu'elles consomment généralement davantage d'espace de stockage Flash, sans pour autant offrir de meilleurs résultats.

Simplicité de déploiement et de gestion. Virtual Storage Tier fonctionne avec les volumes de données et les LUN existants, sans que vous n'ayez besoin d'apporter des modifications complexes ou perturbatrices à votre environnement de stockage. En outre, le transfert de données ne requiert aucune définition de règles, de seuils ou de fenêtres de temps. Votre seule responsabilité consiste à installer la technologie Flash sur vos systèmes de stockage. Une fois cette opération effectuée, Virtual Storage Tier est activé pour tous les volumes gérés par le contrôleur de stockage. Vous pouvez alors exclure de Virtual Storage Tier les données utilisateur associées à des volumes de moindre priorité.

Toutes les autres solutions AST impliquent des modifications incrémentielles de l'infrastructure de stockage existante, notamment en ce qui concerne la structure, la classification des données et les règles. La création de pools de stockage dédiés et la migration des données en sont deux exemples.

Intégration totale. Virtual Storage Tier est parfaitement intégré à l'architecture de stockage unifié de NetApp. Vous pouvez donc l'utiliser sans aucune modification avec le protocole de stockage NAS ou SAN.

Par ailleurs, les solutions AST basées sur la migration ne prennent pas toujours en charge les fonctionnalités qui visent à améliorer l'efficacité du stockage, telles que la déduplication. NetApp Virtual Storage Tier exploite quant à lui toutes les fonctions proposées par NetApp dans ce domaine (provisionnement fin, technologie FlexClone®, déduplication, compression, etc.). Cette étroite intégration représente un avantage de taille, puisqu'elle optimise le fonctionnement de Virtual Storage Tier.

À titre d'exemple, lorsque vous dédupliquez un volume, les bénéfices de cette opération se répercutent également dans Virtual Storage Tier. Un seul et même bloc peut être associé à plusieurs pointeurs de métadonnées au sein de Virtual Storage Tier, ce qui accroît la probabilité de nouvelles lectures et donc la valeur de promotion de ce bloc. Cet effet d'amplification du cache signifie par ailleurs qu'un bloc individuel peut faire office de multiples blocs logiques. Vous pouvez ainsi améliorer considérablement les performances des environnements de virtualisation des serveurs et postes de travail (notamment réduire la durée des « boot storms »), tout en minimisant l'espace requis sur les supports Flash.

Conclusion

Notre approche AST basée sur la mise en cache offre de nombreux avantages à NetApp Virtual Storage Tier par rapport aux solutions basées sur la migration. La promotion des données en temps réel induit une accélération du stockage qui bénéficie aux pics d'activité, même les plus brefs. Notre niveau de granularité de 4 Ko permet en outre d'exclure efficacement les données inutilisées des supports Flash, de manière à optimiser l'usage de l'espace de stockage. Par comparaison, les solutions AST basées sur la migration offrent une granularité moindre et un délai de promotion plus long. Elles nécessitent en outre davantage d'E/S au niveau du disque dur et n'utilisent pas les supports Flash coûteux de manière aussi efficace.

Dans les faits, Virtual Storage Tier utilise les disques durs comme un niveau de capacités et les supports Flash comme un niveau de performances. Si vous possédez plusieurs types de disques durs (Fibre Channel, SATA, SAS, etc.), vous pouvez utiliser le disque de votre choix comme niveau de capacités, tandis que Virtual Storage Tier fournit les performances. Nous sommes convaincus que l'alliance d'un niveau hautes performances (basé sur Virtual Storage Tier) et d'un niveau de disque dur unique (basé sur la technologie SATA) constitue la solution de demain pour la plupart des applications.

 Vous avez des commentaires sur les technologies AST ?

Posez vos questions, échangez des idées et partagez vos points de vue directement en ligne via les communautés NetApp.

Paul Feresten
Responsable marketing produits senior
NetApp


Paul Feresten a rejoint NetApp en 2005. Ses domaines de spécialité incluent certains des principaux logiciels NetApp (notamment Data ONTAP®, MultiStore® et FlexClone), ainsi que les technologies de provisionnement fin. Il cumule plus de 30 ans d'expérience dans le secteur, à des postes de responsable de gestion des produits, de responsable des ventes et du marketing et de directeur général. Avant de rejoindre NetApp, Paul a travaillé pour Data General, Digital Equipment Corporation, MSI Consulting et SEPATON.



Rajesh Sundaram
Directeur technique
NetApp


Depuis qu'il a rejoint NetApp en 1997, Rajesh Sundaram a travaillé sur le système de fichiers WAFL, le sous-système Data ONTAP RAID et l'intégration de la technologie Flash aux solutions de stockage NetApp. Il possède une maîtrise en sciences informatiques de l'université d'Arizona.


Tech OnTap
S'inscrire dès maintenant
Tech OnTap propose chaque mois des informations techniques, mais également des meilleures pratiques, des conseils et outils, des interviews d'ingénieurs, des démonstrations, des évaluations et bien plus encore.

Pour vous inscrire dès aujourd'hui, consultez Tech OnTap dans la communauté NetApp.

Explorer
Explorer
Plus d'informations sur Virtual Storage Tier (VST)

Vous souhaitez en savoir plus sur Virtual Storage Tier ? Nous venons de publier un livre blanc qui vous révélera tous les détails sur cette nouvelle technologie, notamment les performances qu'elle permet d'obtenir dans certains environnements.


Postes de travail virtuels et Virtual Storage Tier

NetApp Virtual Storage Tier a un impact considérable sur les environnements de postes de travail virtuels. Un bulletin de blog publié récemment par Vaughn Stewart décrit les charges extrêmes que ces environnements peuvent générer. Il explique également en quoi Virtual Storage Tier contribue à réduire le nombre de piles de disques, à augmenter le nombre de postes de travail pris en charge dans l'environnement de stockage, et à optimiser le débit de données général.


Mise en cache intelligente

Flash Cache peut diminuer vos coûts de stockage, en réduisant de près de 75 % le nombre de piles de disques nécessaires pour obtenir un niveau de performances donné et en vous permettant de remplacer des disques hautes performances par des options plus économiques. Découvrez-en plus sur cette technologie révolutionnaire.

Explorer
 
TRUSTe
Nous contacter   |   Choisir un partenaire   |   Commentaires   |   Offres d'emploi  |   Abonnements   |   Déclaration de confidentialité   |   © 2011 NetApp