NetApp : Tech OnTap Logo NetApp
NetApp : Tech OnTap
     
Continuité de l'activité grâce à clustered Data ONTAP
Charlotte Brooks
Ingénieur marketing et technique

La transition vers une infrastructure partagée rend quasiment impossible la planification de temps d'indisponibilité pour effectuer des opérations de maintenance de routine. Un même système de stockage peut être virtualisé entre plusieurs applications, collaborateurs ou groupes d'utilisateurs. Convenir d'une fenêtre de maintenance peut donc prendre beaucoup de temps, susciter le mécontentement de tous, voire se révéler impossible. De plus, même s'ils peuvent être réalisés avec une interruption minime, les processus de mise à niveau et de remplacement du matériel qui arrive en fin de vie s'avèrent fastidieux et difficiles à planifier.

Clustered NetApp® Data ONTAP® permet d'éliminer les temps d'indisponibilité planifiés liés aux opérations de maintenance et de renouvellement du matériel, ainsi que les temps d'indisponibilité non planifiés suite aux pannes logicielles et matérielles. NetApp vise à garantir la disponibilité et la résilience de votre infrastructure de stockage à tout moment sans aucun temps d'indisponibilité. Nous estimons que la distribution des données exige le même niveau de fiabilité que tout autre service d'approvisionnement : lorsque vous ouvrez le robinet, vous vous attendez à voir l'eau couler.

La continuité de l'activité NetApp protège votre infrastructure contre les temps d'indisponibilité planifiés ou non, tout en simplifiant considérablement la maintenance et le renouvellement du matériel.

Figure 1) La continuité de l'activité NetApp protège votre infrastructure contre les temps d'indisponibilité planifiés ou non, tout en simplifiant considérablement la maintenance et le renouvellement du matériel.

Nos fonctionnalités de mobilité des données et des réseaux permettent d'accomplir ces tâches de maintenance et de renouvellement du matériel sans aucun temps d'indisponibilité. Les avantages de la continuité de l'activité sont indéniables et nombre d'entre eux influent directement sur les résultats de l'entreprise :

  • Déploiement plus rapide de nouveau matériel et/ou de mise à niveau logicielle. Vous est-il déjà arrivé de recevoir du nouveau matériel et d'avoir à le stocker pendant plusieurs mois le temps de planifier l'interruption nécessaire à sa mise à niveau ? Lorsque c'est le cas, le retour sur investissement est loin d'être positif. Grâce à la continuité de l'activité, vous n'aurez plus jamais à attendre.
  • Taux d'utilisation plus élevé. Comme vous pouvez ajouter de la capacité supplémentaire lorsque cela est nécessaire et sans prévoir de temps d'indisponibilité, vous pouvez accroître considérablement l'utilisation de votre cluster NetApp. Vous n'avez plus à prévoir de filet de sécurité en conservant de la capacité de stockage inutilisée.
  • Simplification de l'activité. Les temps d'indisponibilité planifiés impliquent souvent de passer un temps considérable à mettre hors ligne les applications en cours d'exécution. Vous devez ensuite redémarrer ces applications et vérifier que tout fonctionne correctement une fois les opérations de maintenance terminées. La continuité de l'activité vous permet de vous concentrer sur vos tâches de stockage, tout en évitant la complexité. Les outils NetApp dédiés à la continuité de l'activité sont simples d'utilisation et garantissent la reproductibilité si nécessaire.

Dans cet article, je vous propose d'étudier plus en détail les outils NetApp dédiés à la continuité de l'activité, puis de découvrir comment ces fonctionnalités permettent d'effectuer des tâches importantes de maintenance et de renouvellement du matériel.

Outils

Clustered Data ONTAP garantit la continuité de l'activité en assurant la résilience en cas de panne et en vous permettant de modifier votre infrastructure de stockage sans interruption, afin de faciliter les opérations quotidiennes et la maintenance. Pour y parvenir, clustered Data ONTAP accède aux données par le biais d'une structure logique appelée Storage Virtual Machine (SVM) au lieu d'accéder directement aux ressources physiques. Par conséquent, les ressources physiques utilisées par un SVM peuvent être modifiées, sans exiger d'interruptions ou de modifications au niveau du client ou de l'hôte.

Les SVM clustered Data ONTAP dissocient l'accès aux données du matériel physique pour plus de flexibilité.

Figure 2) Les SVM clustered Data ONTAP dissocient l'accès aux données du matériel physique pour plus de flexibilité.

Trois outils standard jouent un rôle prédominant :

  • DataMotion™ for Volumes (déplacement de volumes). Vous permet de déplacer des volumes de données entre des agrégats sur le même nœud de cluster ou vers un nœud différent.
  • Migration de LIF. Les interfaces logiques (LIF) virtualisent les interfaces physiques dans clustered Data ONTAP. La migration de LIF vous permet de déplacer des LIF d'un port réseau vers un autre, sur le même nœud de cluster ou vers un nœud différent.
  • Transfert d'agrégats (ARL). Vous permet de transférer des agrégats complets depuis un contrôleur d'une paire haute disponibilité vers un autre sans déplacer de données.

Utilisés individuellement ou de manière combinée, ces outils vous permettent d'effectuer de très nombreuses opérations sans interruption, comme déplacer un volume depuis un disque rapide vers un plus lent ou encore procéder à une mise à jour technologique complète du stockage et du contrôleur.

DataMotion for Volumes

DataMotion for Volumes (également appelé déplacement de volumes) vous permet de déplacer un volume d'un SVM depuis un agrégat (la source) vers un autre agrégat (la destination). La destination peut se trouver sur le même nœud ou sur tout autre nœud du cluster. Peu importe la destination des données et le protocole de données utilisé (SAN ou NAS), les applications clients/hôtes bénéficient d'un accès permanent aux données en toute transparence avant, pendant et après le déplacement.

Le processus de déplacement de volumes compte quatre phases. Une fois initié, le déplacement de volumes progresse automatiquement, mais il est important de connaître chaque phase et les activités sous-jacentes.

  • Phase de validation. Durant cette phase, le système vérifie que la demande de déplacement de volumes peut être honorée en contrôlant notamment la capacité disponible au niveau de l'agrégat de destination.
  • Phase de configuration. Un nouveau volume est créé sur l'agrégat de destination.
  • Phase itérative. Les données sont répliquées depuis le volume source vers le volume de destination en répliquant des groupes de copies Snapshot™ sur le réseau du cluster. Après chaque itération, la source et la destination sont comparées afin de vérifier que le delta est suffisamment faible pour qu'une réplication finale puisse être réalisée dans les délais définis lors de la phase de mise en service. Les E/S depuis les clients et les hôtes vers le volume source ne sont pas affectées pendant cette phase.
  • Phase de mise en service. Tous les accès d'E/S sont placés en file d'attente et les demandes destinées au volume source sont bloquées. Le transfert de réplication finale est effectué et la base de données des volumes est mise à jour pour prendre en compte les informations relatives au nouveau volume. Les E/S en attente sont ensuite réactivées au niveau du volume stocké au nouvel emplacement. La mise en service s'achève dans des délais définis, c'est-à-dire dans un intervalle acceptable pour l'application client/hôte.

Si la mise en service ne peut pas être réalisée dans les délais spécifiés, la phase de mise en service est abandonnée et l'accès aux données aux données est rétabli sur le volume source. Toutes les demandes placées en attente pendant l'essai de mise en service sont traitées et la phase d'itération reprend si les conditions sont réunies pour procéder à une nouvelle tentative de mise en service.

Vous pouvez choisir une fenêtre de mise en service comprise entre 30 et 300 secondes. La valeur par défaut est fixée à 45 secondes. Néanmoins, comme il s'agit de la phase la plus critique du processus de déplacement de volumes, vous disposez d'un certain contrôle sur la mise en service. Vous pouvez par exemple choisir de déclencher vous-même la mise en service et l'exécuter ainsi au moment qui vous convient le mieux.

Migration de LIF

La migration de LIF vous permet de déplacer des connexions réseau, à la manière du déplacement de volumes de données. Une LIF est une interface réseau logique qui virtualise vos connexions réseau SAN et NAS. Les LIF sont liées à un SVM et mappées à des ports réseau physiques, à des groupes d'interfaces ou à des VLAN (lorsque l'étiquetage est utilisé) au niveau du contrôleur. Les LIF étant virtualisées, l'adresse de la LIF reste identique même lorsque la LIF est déplacée vers un autre port physique sur le même nœud ou sur un autre nœud du cluster. Les LIF NAS basculent automatiquement si un nœud du cluster est défaillant, tout en s'associant au basculement du stockage dans la paire haute disponibilité pour préserver l'accès aux données. Vous pouvez également migrer manuellement une LIF vers un autre port.

Chaque nœud du cluster peut prendre en charge 262 LIF maximum, dont 6 sont réservées à la gestion et aux fonctions du cluster. Les LIF de données permettent de fournir des données à des clients ou à des hôtes et sont conçues pour des environnements SAN ou NAS. Des adresses IP sont attribuées aux LIF basées sur IP (NAS ou iSCSI) et des WWPN sont attribués aux LIF basées sur FC. Chaque SVM exige au moins une LIF de données. En conditions normales de fonctionnement, le nombre de LIF de données est limité à 128 maximum par nœud. Ainsi, en cas de basculement haute disponibilité, vous respecterez le seuil maximal du nœud partenaire, même si toutes les LIF du nœud défaillant basculent.

Outre les LIF de données, il existe également des LIF de gestion qui permettent d'accéder au cluster via CLI ou OnCommand® System Manager, et des LIF intercluster dédiées au réseau d'interconnexion de cluster.

La migration de LIF vous permet de déplacer une LIF basée sur IP depuis un port physique ou un groupe d'interfaces vers un autre. Les LIF de données SAN (y compris iSCSI) n'ont pas besoin d'être migrées et ne basculent pas. En effet, des processus ALUA et MPIO sont utilisés au niveau des hôtes avec des initiateurs pour optimiser les chemins d'accès et gérer les défaillances sur les chemins.

Vous pouvez utiliser la migration de LIF pour déplacer toutes les LIF de données (et donc tout le trafic sur le réseau) depuis un nœud spécifique pour effectuer des opérations de maintenance ou de remplacement du matériel. Cette fonctionnalité vous permet également de procéder à la mise à niveau sans interruption depuis un cluster d'entrée de gamme à 2 nœuds sans commutateur (nouveauté dans clustered Data ONTAP 8.2) vers un cluster à 2 nœuds avec commutateur. La migration de LIF permet de déplacer les LIF d'interconnexion de cluster, afin de pouvoir ajouter un commutateur sans interrompre le flux de données. Une fois le commutateur installé, vous pouvez développer le cluster si nécessaire pour créer de plus grandes configurations.

Vous pouvez utiliser la migration de LIF pour déplacer une LIF vers un autre port sur le même nœud. Vous pouvez, par exemple, configurer une LIF sur un port GbE. Si cette LIF exige plus de bande passante, vous pouvez la déplacer de façon temporaire ou permanente vers un port 10GbE sur le même nœud.

Pour en savoir plus sur les LIF et les autres sujets relatifs à la mise en réseau de clustered Data ONTAP, consultez l'article TR-4182 sur les meilleures pratiques dédiées aux configurations réseau clustered Data ONTAP.

Transfert d'agrégats

Le transfert d'agrégats (ARL) est une nouvelle fonctionnalité de clustered Data ONTAP 8.2. Étant donné que tous les nœuds de cluster dans clustered Data ONTAP font partie d'une paire haute disponibilité (à l'exception des clusters à un seul nœud), le transfert d'agrégats permet de déplacer temporairement des agrégats depuis un contrôleur d'une paire haute disponibilité vers un autre. Le processus de mise à niveau s'en trouve simplifié, sans déplacement de données.

Grâce à l'ARL, les mises à niveaux des contrôleurs sont beaucoup plus rapides que s'il fallait migrer des données vers les autres contrôleurs, puis mettre à niveau les contrôleurs existants avant de re-déplacer les données. Un récent article Tech OnTap® de Julian Cates, intitulé Nouveautés de clustered Data ONTAP 8.2 a présenté la fonctionnalité ARL en détail, notamment son fonctionnement et les meilleures pratiques d'utilisation.

Réalisation des tâches de maintenance et de renouvellement du matériel

Maintenant que vous connaissez les outils de base, voyons comment les utiliser pour effectuer des tâches de maintenance et de renouvellement du matériel. Le Tableau 1 présente certaines de ces tâches et décrit les avantages dont vous pouvez bénéficier en les réalisant sans interruption.

Tableau 1) Exemples d'opérations de maintenance et de renouvellement du matériel sans interruption.

Renouvellement du matérielAvantages
  • Rééquilibrage des performances du contrôleur, de la capacité et/ou des performances des disques, et du taux d'utilisation
  • Baisse des dépenses d'investissement (dépenses initiales)
  • Meilleure gestion du renouvellement
  • Suppression des zones réactives (meilleures performances, baisse des risques de pannes non planifiées)
  • Ajout de contrôleurs de stockage ou de tiroirs disques
  • Ajout de matériel aux contrôleurs
  • Amélioration des performances et de la densité
  • Amélioration de la résilience
  • Mise à niveau des contrôleurs de stockage, des tiroirs disques, des commutateurs du cluster
  • Mises à jour technologiques sans interruption
Maintenance 
  • Mise à niveau du logiciel de stockage
  • Exploitation plus rapide des nouvelles fonctionnalités
  • Mise à niveau du micrologiciel, du commutateur, du disque et du système
  • Suppression des risques potentiels
  • Remplacement d'un contrôleur ou d'un composant de contrôleur défaillant (par ex. cartes réseau et HBA), et des composants de stockage défectueux (par ex. câbles, disques et modules d'E/S)
  • Baisse des charges administratives

Réalisation des tâches de maintenance

La plupart des données survivront au système de stockage dans lequel elles sont stockées. À terme, les logiciels devront être mis à jour et le matériel devra être remplacé ou réparé.

Mise à niveau du logiciel et du micrologiciel

Les mises à niveau sans interruption englobent la mise à niveau du logiciel et du micrologiciel du système de stockage. Cette solution complète assure la mise à niveau des composants suivants :

  • Logiciel du système d'exploitation (Data ONTAP)
  • Micrologiciel du système d'exploitation (BIOS)
  • Micrologiciel du tiroir
  • Micrologiciel du disque
  • Micrologiciel d'ACP (Alternate Control Path)

Ces tâches peuvent toutes être effectuées avec une interruption minime des E/S. Les applications continuent de s'exécuter, ce qui évite d'avoir à informer les utilisateurs ou de planifier des temps d'indisponibilité. Le basculement et le rétablissement du stockage (à l'aide du transfert d'agrégats), associés à la migration de LIF, vous permettent d'effectuer des opérations de maintenance sur un contrôleur d'une paire haute disponibilité de manière simultanée et sans interrompre les services de données. Vous pouvez faire appel à l'outil Upgrade Advisor (accès obligatoire au site de support NetApp) de My AutoSupport™ pour planifier des mises à niveau sans interruption. Cet outil génère une liste complète d'étapes indispensables pour procéder à la mise à niveau de tout le cluster.

Avant clustered Data ONTAP 8.2, les mises à niveau du système d'exploitation devaient être réalisées en suivant une procédure de « déploiement de mise à niveau », qui mettait à niveau une seule paire haute disponibilité à la fois. En cas de clusters de grande taille, cette opération prenait énormément de temps. Depuis clustered Data ONTAP 8.2, vous pouvez procéder à des mises à niveau par lot de clusters comptant 8 nœuds ou plus. La mise à niveau des grands clusters est donc nettement plus rapide. La mise à niveau par lot vous permet de procéder à la mise à niveau simultanée de plusieurs nœuds, ce qui réduit la durée de l'opération pour l'ensemble du cluster. Un cluster peut exécuter deux versions différentes de clustered Data ONTAP lors d'une mise à niveau, mais la meilleure pratique consiste à réduire au maximum la durée d'exécution du cluster en mode mixte. D'où l'intérêt des mises à niveau par lot.

Réparation et remplacement du matériel

La continuité de l'activité prend en charge la réparation ou le remplacement sans interruption de composants matériels du sous-système de stockage, tels que les disques, les câbles, les contrôleurs et les tiroirs. Les disques sont protégés par la technologie RAID et peuvent être réparés et remplacés en suivant des procédures standard qui n'exigent généralement pas les outils mentionnés précédemment. De nombreux composants redondants, comme les câbles, peuvent également être remplacés en cas de panne sans recourir à ces outils.

Réalisation d'opérations de renouvellement du matériel

Les opérations de renouvellement du matériel comprennent l'ensemble des activités destinées à équilibrer et à optimiser la capacité et/ou les performances, ainsi que les opérations visant à développer ou à actualiser la technologie de votre cluster. Une infrastructure clustered Data ONTAP est flexible et résiliente aux nombreux changements nécessaires qui se produisent pendant les années d'activité.

Peu importe la qualité de votre planification, il est inévitable que certains agrégats manquent de capacité alors que d'autres en ont trop. Ce type de déséquilibre peut facilement être corrigé grâce au déplacement de volumes qui transfère des volumes depuis des agrégats surchargés vers des agrégats libres.

Les déséquilibres qui touchent les performances peuvent être traités de manière similaire. Les volumes qui exigent des performances plus élevées peuvent être déplacés vers un contrôleur disposant de plus de capacité (dans un cluster mixte), vers un contrôleur moins chargé ou vers un support plus rapide. Vous pouvez, par exemple, déplacer un volume qui exige des performances supérieures depuis un agrégat composé de disques haute capacité vers un agrégat intégrant des disques hautes performances. Vous pouvez également le transférer vers un contrôleur Flash Cache™ ou Flash Pool™ qui combine des disques durs et des disques SSD. Inversement, si les exigences d'un jeu de données en termes de performances sont revues à la baisse, vous pouvez déplacer le ou les volumes concernés vers un agrégat composé de disques haute capacité.

Pour les administrateurs d'un cluster Data ONTAP, le déplacement de volumes est une opération standard qui n'exige généralement pas de demande de modification. Le déplacement de volumes permet à votre équipe informatique d'atteindre ses objectifs en termes de capacité et de performances et d'optimiser les opérations sans grever le budget. En effet, elle peut facilement déplacer des données vers la classe de stockage adéquate pour répondre aux besoins des applications au lieu de tout provisionner et déployer sur des disques onéreux hautes performances.

Mise à jour technologique

L'atout majeur de la continuité de l'activité NetApp est la possibilité d'effectuer une mise à jour technologique complète sans aucune interruption. Remplacer du matériel de stockage a toujours pris beaucoup de temps et a toujours été source d'interruptions et de coûts élevés. Selon une étude récente, la migration des données depuis une ancienne baie de stockage vers une nouvelle baie durerait en moyenne 5 mois et augmenterait le coût de possession d'une baie de près de 50 %.

Clustered Data ONTAP vous permet de procéder facilement à des mises à jour matérielles complètes sans avoir à mettre vos données hors ligne, ce qui vous permet aussi d'éliminer ces faux frais. Comme vos systèmes de stockage en cluster ne sont pas nécessairement de la même génération ou du même modèle, vous pouvez remplacer une plateforme FAS ou changer l'intégralité de votre infrastructure de stockage sans interrompre les applications en cours d'exécution ni les activités des utilisateurs. Aucun autre fournisseur de solutions de stockage n'offre cet avantage.

Vous pouvez avoir recours au transfert d'agrégats pour mettre à niveau des contrôleurs de stockage existants de façon rapide et pratique. Vous pouvez également utiliser le déplacement de volumes pour procéder aux mises à niveau complètes, y compris des disques et des tiroirs. Dans le deuxième cas, vous ajoutez généralement le nouveau système au cluster, puis vous déplacez les données vers ce nouveau système avant de supprimer l'ancien.

Ce n'est pas que de la théorie ; des mises à jour technologiques complètes ont été effectuées de nombreuses fois. Par exemple, un utilisateur équipé depuis longtemps de clustered Data ONTAP est passé sans interruption d'un cluster de plus de 20 systèmes FAS6080 à un cluster intégrant 16 systèmes FAS6280, chacun d'eux disposant de stockage Flash Cache de 512 Go. La capacité totale avant et après la mise à jour est toujours d'environ 1 Po.

La transition a été accomplie par groupes de quatre. L'équipe informatique a ajouté quatre nouveaux nœuds et a déplacé les volumes de quatre des anciens nœuds vers les nouveaux nœuds. Les anciens nœuds ont ensuite été désactivés et les tiroirs disques toujours pris en charge (une partie du matériel était très ancienne et a dû être désinstallée) ont été déplacés vers le prochain jeu de nouveaux nœuds.

Les utilisateurs ont signalé une augmentation notable du débit et des performances, de même qu'une baisse des coûts de maintenance. Plus important encore, l'intégralité du processus a pu s'effectuer sans interruption. Notez également que la disponibilité du transfert d'agrégats simplifie et accélère davantage ce type de mise à niveau. Certains pionniers ont déjà utilisé la fonctionnalité ARL pour actualiser des clusters complets en une journée, sans imposer de migration des données, ni de temps d'indisponibilité.

Conclusion

Avec clustered Data ONTAP, la continuité de l'activité atteint un nouveau niveau. Quelques outils simples, comme le déplacement de volumes, la migration de LIF et le transfert d'agrégats, permettent de réaliser rapidement et facilement des opérations de maintenance et de renouvellement du matériel qui étaient impossibles à effectuer auparavant sans temps d'indisponibilité planifiés et sans interruption majeure. La possibilité d'effectuer des tâches à la demande sans attendre les rares fenêtres de maintenance implique l'optimisation de votre environnement de stockage et une baisse considérable des risques.

 Vous avez des commentaires sur la continuité de l'activité ?

Posez vos questions, échangez des idées et partagez vos points de vue directement en ligne via les communautés NetApp.

Par Charlotte Brooks, Ingénieur marketing et technique

Charlotte Brooks est ingénieur marketing et technique spécialisée sur clustered Data ONTAP. En plus de 5 ans passés chez NetApp, elle a rédigé de nombreux articles et de multiples présentations sur clustered Data ONTAP et la gestion du stockage en général. Elle s'intéresse plus particulièrement à la continuité de l'activité et aux mises à niveau sans interruption.

Tech OnTap
S'inscrire dès maintenant
Tech OnTap propose chaque mois des informations techniques, mais également des meilleures pratiques, des conseils et des outils, des interviews d'ingénieurs, des démonstrations, des évaluations et bien plus encore.

Pour vous inscrire dès aujourd'hui, consultez Tech OnTap dans la communauté NetApp.

Explorer
Explorer
En savoir plus sur clustered Data ONTAP 8.2 et sur la continuité de l'activité

Dans un article paru le mois dernier, Julian Cates, ingénieur marketing et technique chez NetApp, a passé en revue les nouvelles fonctionnalités de la version 8.2 et détaillé le transfert d'agrégats, la qualité de service et les améliorations de Microsoft® Windows®. Retrouvez son article ci-dessous et consultez un nouveau livre blanc présentant les atouts de la continuité de l'activité, de l'efficacité et de l'évolutivité.

Explorer
 
TRUSTe
Nous contacter   |   Choisir un partenaire   |   Commentaires   |   Offres d'emploi  |   Abonnements   |   Déclaration de confidentialité   |    © 2013 NetApp.