Passer au contenu principal

Collaborez mieux, partout : mise en cache des données avec Amazon FSx pour NetApp ONTAP

Table of Contents

Partager cette page

Yifat Perry
Yifat Perry

Les patrimoines de données en constante expansion et les équipes distribuées travaillant aujourd'hui à distance ont modifié les exigences imposées aux données. La récupération rapide des données et une collaboration efficace sur des datasets partagés dans divers environnements sont essentielles, quel que soit l'endroit où les données sont hébergées.

Ce type de distribution de données peut être un cauchemar à orchestrer, avec des problèmes d’intégrité, d’incompatibilité et de performances qui peuvent tous causer des difficultés. Les organisations ont besoin de moyens pour accélérer l’accès aux données et promouvoir l’agilité et la collaboration sans ces défis.

NetApp et AWS se sont associés pour proposer la solution : la mise en cache des données avec Amazon FSx pour NetApp ONTAP. Cet article explore les capacités de mise en cache des données de FSx pour ONTAP qui aident à relever les défis liés au travail avec des données dispersées à l’échelle mondiale.

Lisez la suite pour en savoir plus ou utilisez ces liens pour accéder à la section qui vous intéresse :

Le défi complexe des données distribuées

Les données distribuées présentent plusieurs défis que les entreprises doivent surmonter :

  • Consolidation des données. Lorsque les données sont réparties sur plusieurs sites, vous devez rassembler les données provenant de différentes sources. Si vous ne pouvez pas les visualiser avec cohérence sous la forme d'un système de fichiers unique, vous ne pouvez pas lire et écrire efficacement les données, ni les analyser pour en tirer une réelle valeur commerciale.
  • Plusieurs namespaces. L’absence de namespaces cohérents entre les données provenant de différentes sources ajoute de la complexité. Pour accéder aux données et les utiliser de manière cohérente, vous devez unifier les différentes conventions et structures de dénomination, mais ce processus nécessite des efforts intensifs.
  • Dégradation des performances. Rendre les données accessibles à tous vos utilisateurs sans que les performances ne se dégradent à un moment donné peut s’avérer difficile. Plus les utilisateurs sont éloignés du dataset, plus ils subissent de latence.

    Vous avez besoin d’un équilibre précis entre un accès à faible latence, une bande passante optimisée et un coût. La création de silos de données dans différents environnements et zones géographiques n'est pas une solution : bien que cela accélère l'accès aux données pour les utilisateurs locaux, cela entraîne des problèmes de synchronisation.
  • Réplication des données. Les données répliquées dans plusieurs environnements doivent être cohérentes et à jour. Le plus grand risque est que des divergences surviennent lors de la réplication, ce qui pourrait compromettre l’intégrité des données.
  • Augmentation des coûts. La nature distribuée des systèmes Edge et Cloud introduit certains défis liés aux coûts. Vous pourriez vous retrouver avec différentes copies complètes de données dans différents emplacements, pour lesquelles vous devrez payer. Vous devez penser à gérer les coûts associés au transfert de données et à la gestion centralisée.

La gestion des complexités du travail avec des données distribuées peut s’avérer extrêmement difficile. C'est là que FSx pour ONTAP peut vous aider.

Mise en cache des données avec FSx pour ONTAP

FSx pour ONTAP est le service de stockage entièrement géré d'AWS qui fournit des solutions fiables de gestion des données NetApp® ONTAP®.

FSx pour ONTAP propose des fonctionnalités de mise en cache qui accélèrent l'accès aux données et favorisent la collaboration en temps réel dans plusieurs environnements. FSx pour ONTAP y parvient de deux manières principales : en consolidant les données à la périphérie et en mettant en cache des copies inscriptibles des données localement.

Consolidation des données à la périphérie

FSx pour ONTAP aide les organisations à consolider les données non structurées pour une expérience haute performance, une efficacité opérationnelle et une collaboration à grande échelle en utilisant la technologie NetApp Global File Cache (GFC). FSx pour ONTAP met en cache uniquement les données nécessaires dans les emplacements respectifs et utilise le protocole SMB (Server Message Block) / Common Internet File System (CIFS). C'est transparent pour l'utilisateur, la collaboration via GFC donne l'impression de travailler avec des fichiers locaux.

GFC peut prendre en charge les architectures de cloud hybride composées de systèmes ONTAP et FSx pour ONTAP sur site en fournissant une solution de stockage centralisée avec un cache de données distribué aux emplacements périphériques. Vos utilisateurs du monde entier peuvent accéder à cet ensemble unique de données, avec une évolutivité pouvant atteindre des pétaoctets.

Étant donné que les données fréquemment utilisées sont mises en cache, vous obtenez de meilleures performances pour les applications collaboratives. La fonction de verrouillage intelligent des fichiers maintient l’intégrité des données même si les données sont accessibles à partir de plusieurs emplacements à l’aide d’un namespace global.

Photo 1 12 mars 2024 12 01 20 2948 PMArchitecture de haut niveau du cache de fichiers global NetApp

Données mises en cache entièrement inscriptibles dans des emplacements distants

FSx pour ONTAP vous permet de créer un cache persistant et inscriptible dans un emplacement distant avec la copie la plus récente et la plus cohérente de vos données. Ces volumes mis en cache inscriptibles et peu remplis peuvent être utilisés pour créer un cache sur le même système ou sur un autre pour accélérer l'accès aux données. La technologie NetApp FlexCache® rend cela possible.

FlexCache1FlexCache dans FSx pour ONTAP.

Les données mises en cache sont accessibles via le système de fichiers réseau (NFS) et SMB/CIFS, ce qui signifie que vous pouvez utiliser les données du cache sans réarchitecturer vos systèmes de quelque manière que ce soit. Ces données sont utiles dans les environnements à lecture intensive où les données sont partagées par plusieurs hôtes et consultées plusieurs fois.

Par souci d'optimisation, seules les données lues par le client sont mises en cache. Les clients peuvent monter n’importe quel volume pour accéder aux mêmes données préremplies et à jour à partir de plusieurs emplacements. Le volume mis en cache agit comme un emplacement de stockage temporaire entre un hôte et la source de données, et il stocke les blocs de données fréquemment consultés afin qu'ils puissent être utilisés plus rapidement que s'ils devaient être récupérés à partir de la source.

Yifat Perry

Yifat Perry

Voir tous les articles de Yifat Perry
Mise en cache des données avec Amazon FSx pour NetApp ONTAP | NetApp