NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
NetApp et Red Hat collaborent sur une solution pNFS
Pranoop Erasani
Directeur technique, NFS
Justin Parisi
Ingénieur marketing et technique

L'accès aux données partagées est essentiel pour les performances d'un grand nombre d'applications qu'elles soient commerciales, scientifiques, financières ou liées à l'ingénierie. NFS, la norme la plus utilisée pour partager l'accès aux données, peut être à l'origine d'un goulet d'étranglement au niveau des clusters de calcul de grande envergure. En effet, ces derniers risquent de saturer les serveurs de fichiers, point d'accès unique à tous les fichiers d'un système de fichiers partagé.

 

La plupart des solutions qui offrent des performances élevées et un accès aux données partagées sont plus ou moins propriétaires. De plus, elles ne sont pas aussi performantes en termes de prise en charge de systèmes hétérogènes que des protocoles standard comme NFS, et elles ne sont pas aussi largement adoptées.

 

La norme pNFS (parallel NFS), qui fait partie de la spécification de protocole NFS version 4.1 (RFC 5661), répond aux problématiques de goulets d'étranglement liées à l'utilisation de serveurs uniques. Très prometteuse, cette technologie pourrait bien devenir LA solution en termes d'accès parallèle aux données. Dans cet article, nous expliquerons le fonctionnement de la pNFS, l'état d'avancement du processus de normalisation par NetApp et Red Hat, ainsi que l'implémentation de pNFS dans clustered NetApp® Data ONTAP®.

À quoi correspond le protocole pNFS ?

Le protocole pNFS permet aux clients d'accéder directement aux fichiers répartis sur deux serveurs de données ou plus. En accédant de manière parallèle à plusieurs serveurs de données, les clients peuvent bénéficier d'une accélération importante des opérations d'E/S. Le protocole pNFS permet une évolutivité des performances en toute transparence par client et par fichier, sans nuire à la rétro-compatibilité avec le protocole NFS standard. Les clients sans l'extension pNFS peuvent continuer à accéder aux données.

 

Architecture et protocoles pNFS

 

L'architecture pNFS s'articule autour de trois composants principaux :

 

  • Le serveur de métadonnées gère tout le trafic qui n'est pas lié aux données. Il assure la maintenance des métadonnées, qui décrivent l'emplacement et le mode de stockage de chaque fichier.
  • Les serveurs de données stockent les données des fichiers et répondent directement aux demandes de lecture et d'écriture. Les données des fichiers peuvent être réparties sur plusieurs serveurs de données.
  • Un ou plusieurs clients peuvent directement accéder aux serveurs de données sur la base des informations contenues dans les métadonnées reçues du serveur.

 

Trois types de protocoles sont utilisés entre les clients, le serveur de métadonnées et les serveurs de données :

 

  • Un protocole de contrôle est utilisé pour synchroniser le serveur de métadonnées et les serveurs de données. Non défini par la spécification pNFS, il peut varier d'un fournisseur à l'autre.
  • Le protocole pNFS est utilisé entre les clients et le serveur de métadonnées. Il s'agit essentiellement du protocole NFSv4, auquel s'ajoutent des extensions spécifiques à pNFS. Il permet de récupérer et de manipuler les dispositions qui contiennent les métadonnées indiquant l'emplacement et le protocole d'accès au stockage requis pour accéder aux fichiers stockés sur différents serveurs de données.
  • Un ensemble de protocoles d'accès au stockage est utilisé par les clients pour accéder directement aux serveurs de données. La norme pNFS comporte actuellement trois catégories de protocoles de stockage : basés sur les fichiers (RFC5661), les blocs (RFC5663) ou les objets (RFC5664). Clustered Data ONTAP prend actuellement en charge le protocole de stockage basé sur les fichiers et utilise NFSv4.1 pour accéder aux serveurs de données.

 

 

Éléments du pNFS. Les clients adressent une requête au serveur de métadonnées concernant la disposition (protocole pNFS), puis accèdent directement aux serveurs de données (protocole d'accès au stockage).

Figure 1) Éléments du pNFS. Les clients adressent une requête au serveur de métadonnées concernant la disposition (protocole pNFS), puis accèdent directement aux serveurs de données (protocole d'accès au stockage).

 

 

Afin d'accéder à un fichier, un client contacte le serveur de métadonnées pour pouvoir ouvrir le fichier et en demander la disposition. Une fois qu'il l'a reçue, il utilise cette information pour procéder directement aux opérations d'E/S vers et depuis les serveurs de données, de manière parallèle, en utilisant le protocole d'accès au stockage, et sans devoir recourir à nouveau au serveur de métadonnées. Les clients pNFS mettent en cache la disposition jusqu'à ce qu'ils aient terminé les opérations d'E/S en parallèle. Les serveurs pNFS sont autorisés à révoquer la disposition du fichier si le serveur ne peut pas garantir un accès parallèle aux serveurs. De plus, pNFS ne modifie pas le mécanisme actuellement disponible dans le serveur NFS pour l'accès aux métadonnées.

NetApp et Red Hat font équipe pour une solution pNFS

Pour fonctionner, une solution pNFS a besoin des composants client et serveur. NetApp et Red Hat ont longuement travaillé en collaboration avec la communauté open source pour proposer la première offre standardisée pNFS de bout en bout.

 

NetApp répond aux défis de l'évolutivité en combinant la mise en cluster du stockage et la norme pNFS. Les systèmes de stockage NetApp FAS et V-Series qui exécutent clustered Data ONTAP 8.1 ou une version ultérieure peuvent évoluer de quelques téraoctets de données seulement à plus de 69 pétaoctets, lesquels peuvent être gérés comme une seule entité de stockage. La gestion de l'environnement pNFS en est simplifiée, et les temps d'indisponibilité, planifiés ou non, sont éliminés.

 

Grâce au premier client pNFS entièrement pris en charge et fourni sous Red Hat Enterprise Linux®, vous pouvez commencer à planifier et à créer des solutions de systèmes de fichiers évolutives de nouvelle génération et basées sur pNFS. Les charges de travail applicatives peuvent bénéficier pleinement de la norme pNFS sans devoir être modifiées, ce qui permet une transition transparente pour les applications existantes.

pNFS et clustered Data ONTAP

NetApp a implémenté pNFS dans clustered Data ONTAP à partir de la version 8.1. (Il n'y a pas d'implémentation en 7-Mode ou dans Data ONTAP 7G.) L'implémentation de cette norme pNFS dans clustered Data ONTAP offre un certain nombre d'avantages :

 

  • Une infrastructure simplifiée. L'infrastructure globale dédiée à pNFS est beaucoup plus simple que celle des autres systèmes de fichiers en parallèle, tels que Lustre et GPFS, qui exigent davantage de serveurs en plus du stockage.
  • La simplicité de gestion. En général, pNFS inclut plusieurs serveurs de fichiers qui doivent être gérés séparément. Clustered Data ONTAP vous permet de gérer tous les composants pNFS côté serveur comme un système unique.
  • La continuité de l'activité. Une installation pNFS sur un cluster NetApp bénéficie de la continuité de l'activité pour les opérations de maintenance et d'équilibrage des charges, telles que le basculement du stockage, les migrations LIF et les déplacements de volume sans interruption, tout comme n'importe quelle autre charge de travail.
  • Tous les nœuds peuvent agir comme des serveurs de métadonnées. Dans une implémentation clustered Data ONTAP, chaque nœud du cluster de stockage peut se comporter à la fois comme un serveur de métadonnées et un serveur de données. Ceci permet de supprimer les éventuels goulets d'étranglement liés à l'utilisation d'un seul serveur de métadonnées et facilite la distribution des opérations de métadonnées dans le cluster.

 

pNFS sur Data ONTAP par rapport à NFS. Chaque nœud peut servir à la fois de serveur de métadonnées et de serveur de données.

Figure 2) pNFS sur Data ONTAP par rapport à NFS. Chaque nœud peut servir à la fois de serveur de métadonnées et de serveur de données.

 

 

Pour comprendre le fonctionnement de pNFS avec clustered Data ONTAP, imaginez un client qui a installé un système de fichiers pNFS à partir d'un des nœuds d'un cluster. Pour accéder à un fichier, il envoie une demande de métadonnées à ce nœud. L'implémentation pNFS rassemble et renvoie des informations, notamment l'emplacement, la disposition du fichier et des informations réseau permettant d'accéder à l'emplacement. Le client utilise ces éléments pour accéder aux données directement depuis le nœud où il se trouve. En fournissant un chemin direct au volume, pNFS permet aux applications d'atteindre un débit plus élevé et une latence plus faible.

 

pNFS s'intègre en toute transparence aux fonctionnalités de continuité de l'activité de clustered Data ONTAP, telles que la migration de LIF, le basculement du stockage et le déplacement de volume. Lors du déroulement de l'une de ces opérations, le serveur et le client pNFS négocient automatiquement le nouveau chemin direct d'E/S vers le serveur, ce qui permet de maintenir le débit sans exiger d'interruption de l'application. Cela représente un avantage énorme pour les administrateurs de stockage, car ils n'ont pas besoin de provisionner de façon explicite les chemins de réseau pendant les opérations de maintenance sur le cluster. Ainsi, non seulement pNFS sur clustered Data ONTAP améliore les performances, mais il simplifie également les flux de travail administratifs lors des activités de maintenance. En cas de provisionnement et de déploiement de grands clusters, cela devient une nécessité.

 

Sans pNFS, les chemins de métadonnées et de données sont plus ou moins statiques. Avec pNFS, le service de métadonnées est réparti sur plusieurs nœuds, tandis que les chemins de données permettent d'accéder directement à l'interface réseau du nœud qui stocke le fichier. Lorsque les données se déplacent, les chemins s'adaptent automatiquement de façon à maintenir des performances optimales.

Figure 3) Sans pNFS, les chemins de métadonnées et de données sont plus ou moins statiques. Avec pNFS, le service de métadonnées est réparti sur plusieurs nœuds, tandis que les chemins de données permettent d'accéder directement à l'interface réseau du nœud qui stocke le fichier. Lorsque les données se déplacent, les chemins s'adaptent automatiquement de façon à maintenir des performances optimales.

 

 

Meilleures pratiques

 

L'application de quelques-unes des meilleures pratiques permet d'optimiser les performances liées à la norme pNFS :

 

  • Il est recommandé de consulter la matrice d'interopérabilité NetApp afin de connaître les dernières informations sur la compatibilité avec les clients NFSv4.1 et pNFS (accès obligatoire au site de support NetApp).
  • Chaque nœud de cluster qui prend en charge la norme pNFS devrait être configuré avec au moins une interface logique (LIF), afin que les clients pNFS puissent accéder directement aux volumes stockés sur ce nœud.
  • Si les charges de travail sont exigeantes en matière de métadonnées, les clients pNFS doivent être configurés de façon à ce que les montages soient distribués sur tous les nœuds du cluster et puissent ainsi tous agir comme des serveurs de métadonnées. Pour cela, il convient d'utiliser un serveur DNS externe et cyclique, ou un équilibrage des charges DNS intégré dans clustered Data ONTAP.

 

Pour plus d'informations sur le déploiement de pNFS dans un système de stockage NetApp, consultez le document TR-4063.

Client pNFS Red Hat

Le client Red Hat pNFS a été lancé pour la première fois dans la version 6.2 du noyau Red Hat Enterprise Linux (RHEL) en 2011. Les versions RHEL 6.2 et RHEL 6.3 ont été qualifiées de « Aperçus techniques » de pNFS.

 

RHEL 6.4, sortie en février 2013, constituait la première version grand public de pNFS. Pour des informations plus complètes sur l'utilisation des clients Red Hat avec un système de stockage NetApp qui exécute NFS ou pNFS, consultez le document TR-3183. (Ce rapport technique est en cours de révision et risque de ne pas être disponible au moment de la publication du présent article. Si tel est le cas, nous vous invitons à vérifier régulièrement sa disponibilité.)

Cas d'utilisation pNFS

Outre leurs utilisations évidentes dans les applications scientifiques et d'ingénierie hautement parallèles, les fonctionnalités uniques de la norme pNFS conviennent parfaitement à de nombreux cas d'utilisation.

 

Applications stratégiques

 

Par définition, les applications stratégiques exigent les niveaux de service les plus élevés. La bande passante et la capacité de stockage doivent évoluer en toute transparence avec la configuration serveur requise. Lorsque les volumes de stockage NetApp migrent de façon transparente vers des contrôleurs plus puissants du cluster NetApp, le client pNFS Red Hat Enterprise Linux suit automatiquement le transfert des données, s'ajuste automatiquement et trace un nouveau chemin de données optimisé. Le temps d'indisponibilité est quasi-nul et aucune reconfiguration du serveur ou des applications n'est requise.

 

Solutions de stockage mutualisées

 

L'accès parallèle aux données permet aux charges de travail mutualisées et hétérogènes de bénéficier directement de la norme pNFS. Les données sont stockées sur le cluster NetApp et ne sont liées à aucun contrôleur NetApp en particulier. Avec pNFS, les serveurs Red Hat Enterprise Linux trouvent le meilleur chemin de données et s'ajustent automatiquement pour un débit optimal.

 

Charges de travail et clients variés

 

NFSv4.1 et pNFS offrent une flexibilité de montage du système de fichiers dans l'espace de noms du cluster. Les applications en cluster peuvent ainsi être montées sur pNFS, tandis que les applications existantes peuvent continuer à être montées sur NFSv3. Les systèmes de fichiers exportés depuis le stockage peuvent avoir leurs clients montés sur différentes versions de NFS, ce qui leur permet de coexister sans apporter de modifications importantes aux applications qui accèdent aux données. Ce niveau de flexibilité permet de réduire la surcharge liée à la gestion des changements fréquents.

 

Environnements de virtualisation

 

Les hyperviseurs et les serveurs virtuels qui utilisent le client pNFS Red Hat Enterprise Linux peuvent prendre en charge plusieurs connexions par session, ce qui répartit la charge sur plusieurs interfaces réseau. C'est l'équivalent des chemins d'accès multiples pour NFS, sans la nécessité d'un pilote ou d'une configuration multivoie distincte.

Conclusion

NetApp a joué un rôle majeur dans le développement de NFSv4.1 et pNFS, assurant la co-présidence du groupe de travail. NetApp a également rédigé et remanié une part importante de la spécification NFSv4.1. Cette démarche s'inscrit dans le respect de notre engagement à relever les défis du stockage grâce aux normes du secteur.

 

Avec la mise à disposition auprès du grand public du client pNFS dans le cadre de la sortie de RHEL 6.4, vous pouvez désormais déployer la norme pour des opérations de test et/ou de production, en utilisant une combinaison de clients Red Hat et de NetApp clustered Data ONTAP.

Vous avez des commentaires ?

Pranoop Erasani est l'architecte NFS principal du département NetApp Protocols Technology Engineering, où il est en charge du développement du protocole NFS pour Data ONTAP. Il a joué un rôle déterminant dans la définition de l'architecture de pNFS pour clustered Data ONTAP et préconise l'exploitation de NFSv4.1/pNFS dans les systèmes en cluster. Il a participé à de nombreuses discussions liées à la norme IETF pNFS et intervient régulièrement lors d'événements relatifs à l'interopérabilité NFS. Enfin, il est Conseiller technique auprès des services de marketing technique et de gestion de produits pour les déploiements clients et les solutions logicielles de stockage.

Justin Parisi, basé sur le site RTP, est depuis 5 ans ingénieur support technique en charge de la réaffectation des problèmes critiques auprès de NetApp Global Support Services. Spécialiste de clustered Data ONTAP, il a rédigé des supports de formation sur la résolution de problèmes et un grand nombre d'articles de la base de connaissances. Il s'intéresse à de multiples domaines, notamment CIFS, NFS, SNMP, OnCommand® System Manager, Unified Manager, SnapDrive®, SnapManager®, ainsi que Microsoft® Exchange, SQL Server®, Active Directory® et LDAP, ce qui lui vaut d'être considéré comme une encyclopédie vivante NetApp.

Explore
Explore
En savoir plus sur la norme pNFS

Vous souhaitez en savoir plus sur la norme pNFS et son déploiement pour accélérer votre environnement IT ? Cliquez sur les liens suivants :

  • Norme pNFS et futures fonctionnalités NFSv4.2
  • Utilisation de la norme pNFS pour une évolutivité horizontale de RHEL und KVM
  • Norme pNFS et NFSv4.1, système de fichiers pour grille, virtualisation et base de données
  • Description de la solution pNFS
    Explore
     
  • TRUSTe
    Nous contacter   |   Choisir un partenaire   |   Commentaires   |   Carrières  |   Abonnements   |    Déclaration de confidentialité   |    © 2013 NetApp