Menu

Collaborez mieux, partout : mise en cache des données avec Amazon FSx pour NetApp ONTAP

Sommaire

Partager cette page

Yifat Perry
Yifat Perry

Les patrimoines de données en constante expansion et les équipes distribuées travaillant aujourd'hui à distance ont modifié les exigences imposées aux données. La récupération rapide des données et une collaboration efficace sur des datasets partagés dans divers environnements sont essentielles, quel que soit l'endroit où les données sont hébergées.

Ce type de distribution de données peut être un cauchemar à orchestrer, avec des problèmes d’intégrité, d’incompatibilité et de performances qui peuvent tous causer des difficultés. Les organisations ont besoin de moyens pour accélérer l’accès aux données et promouvoir l’agilité et la collaboration sans ces défis.

NetApp et AWS se sont associés pour proposer la solution : la mise en cache des données avec Amazon FSx pour NetApp ONTAP. Cet article explore les capacités de mise en cache des données de FSx pour ONTAP qui aident à relever les défis liés au travail avec des données dispersées à l’échelle mondiale.

Lisez la suite pour en savoir plus ou utilisez ces liens pour accéder à la section qui vous intéresse :

Le défi complexe des données distribuées

Les données distribuées présentent plusieurs défis que les entreprises doivent surmonter :

  • Consolidation des données. Lorsque les données sont réparties sur plusieurs sites, vous devez rassembler les données provenant de différentes sources. Si vous ne pouvez pas les visualiser avec cohérence sous la forme d'un système de fichiers unique, vous ne pouvez pas lire et écrire efficacement les données, ni les analyser pour en tirer une réelle valeur commerciale.
  • Plusieurs namespaces. L’absence de namespaces cohérents entre les données provenant de différentes sources ajoute de la complexité. Pour accéder aux données et les utiliser de manière cohérente, vous devez unifier les différentes conventions et structures de dénomination, mais ce processus nécessite des efforts intensifs.
  • Dégradation des performances. Rendre les données accessibles à tous vos utilisateurs sans que les performances ne se dégradent à un moment donné peut s’avérer difficile. Plus les utilisateurs sont éloignés du dataset, plus ils subissent de latence.

    Vous avez besoin d’un équilibre précis entre un accès à faible latence, une bande passante optimisée et un coût. La création de silos de données dans différents environnements et zones géographiques n'est pas une solution : bien que cela accélère l'accès aux données pour les utilisateurs locaux, cela entraîne des problèmes de synchronisation.
  • Réplication des données. Les données répliquées dans plusieurs environnements doivent être cohérentes et à jour. Le plus grand risque est que des divergences surviennent lors de la réplication, ce qui pourrait compromettre l’intégrité des données.
  • Augmentation des coûts. La nature distribuée des systèmes Edge et Cloud introduit certains défis liés aux coûts. Vous pourriez vous retrouver avec différentes copies complètes de données dans différents emplacements, pour lesquelles vous devrez payer. Vous devez penser à gérer les coûts associés au transfert de données et à la gestion centralisée.

La gestion des complexités du travail avec des données distribuées peut s’avérer extrêmement difficile. C'est là que FSx pour ONTAP peut vous aider.

Mise en cache des données avec FSx pour ONTAP

FSx pour ONTAP est le service de stockage entièrement géré d'AWS qui fournit des solutions fiables de gestion des données NetApp® ONTAP®.

FSx pour ONTAP propose des fonctionnalités de mise en cache qui accélèrent l'accès aux données et favorisent la collaboration en temps réel dans plusieurs environnements. FSx pour ONTAP y parvient de deux manières principales : en consolidant les données à la périphérie et en mettant en cache des copies inscriptibles des données localement.

Consolidation des données à la périphérie

FSx pour ONTAP aide les organisations à consolider les données non structurées pour une expérience haute performance, une efficacité opérationnelle et une collaboration à grande échelle en utilisant la technologie NetApp Global File Cache (GFC). FSx pour ONTAP met en cache uniquement les données nécessaires dans les emplacements respectifs et utilise le protocole SMB (Server Message Block) / Common Internet File System (CIFS). C'est transparent pour l'utilisateur, la collaboration via GFC donne l'impression de travailler avec des fichiers locaux.

GFC peut prendre en charge les architectures de cloud hybride composées de systèmes ONTAP et FSx pour ONTAP sur site en fournissant une solution de stockage centralisée avec un cache de données distribué aux emplacements périphériques. Vos utilisateurs du monde entier peuvent accéder à cet ensemble unique de données, avec une évolutivité pouvant atteindre des pétaoctets.

Étant donné que les données fréquemment utilisées sont mises en cache, vous obtenez de meilleures performances pour les applications collaboratives. La fonction de verrouillage intelligent des fichiers maintient l’intégrité des données même si les données sont accessibles à partir de plusieurs emplacements à l’aide d’un namespace global.

Photo 1 12 mars 2024 12 01 20 2948 PMArchitecture de haut niveau du cache de fichiers global NetApp

Données mises en cache entièrement inscriptibles dans des emplacements distants

FSx pour ONTAP vous permet de créer un cache persistant et inscriptible dans un emplacement distant avec la copie la plus récente et la plus cohérente de vos données. Ces volumes mis en cache inscriptibles et peu remplis peuvent être utilisés pour créer un cache sur le même système ou sur un autre pour accélérer l'accès aux données. La technologie NetApp FlexCache® rend cela possible.

FlexCache1FlexCache dans FSx pour ONTAP.

Les données mises en cache sont accessibles via le système de fichiers réseau (NFS) et SMB/CIFS, ce qui signifie que vous pouvez utiliser les données du cache sans réarchitecturer vos systèmes de quelque manière que ce soit. Ces données sont utiles dans les environnements à lecture intensive où les données sont partagées par plusieurs hôtes et consultées plusieurs fois.

Par souci d'optimisation, seules les données lues par le client sont mises en cache. Les clients peuvent monter n’importe quel volume pour accéder aux mêmes données préremplies et à jour à partir de plusieurs emplacements. Le volume mis en cache agit comme un emplacement de stockage temporaire entre un hôte et la source de données, et il stocke les blocs de données fréquemment consultés afin qu'ils puissent être utilisés plus rapidement que s'ils devaient être récupérés à partir de la source.

FlexCache2Les copies de cache pointent vers les blocs de données pertinents dans les données source pour optimiser la taille de la copie.

Cas d'usage de la mise en cache des données avec FSx pour ONTAP

La mise en cache des données avec FSx pour ONTAP peut aider dans un large éventail de scénarios :

  • Emplacements de bureaux distants ou de succursales (ROBO)
  • Workloads de calcul haute performance (HPC)
  • Utilisation de l'intelligence artificielle/du machine learning (IA/ML) et de l'apprentissage profond (DL)
  • Cloud bursting

Avantages de l'utilisation de FSx pour ONTAP et mise en cache des données

Avec FSx pour ONTAP, vous disposez d'une solution à faible surcharge pour tous vos besoins de mise en cache de données :

  • Accès rapide aux données distantes. La mise en cache des données rend les données distantes disponibles plus près des utilisateurs, avec des exigences architecturales supplémentaires minimales, voire nulles.
  • Haute performance. La mise en cache des données avec FSx pour ONTAP élimine les problèmes de latence associés à l'accès aux données du monde entier, sans compromettre l'intégrité ou la qualité des données.
  • Verrouillage de fichiers. Le mécanisme de verrouillage de fichiers FSx pour ONTAP empêche les opérations d'écriture parallèles qui pourraient entraîner des problèmes d'intégrité des données.
  • Configuration sans contact. Les datasets des différents environnements, ceux mis en cache et ceux à la source, sont maintenus cohérents par FSx pour ONTAP sans effort.
  • Protection des données et résilience. FSx pour ONTAP est hautement disponible et résilient par défaut, utilisant une ou plusieurs zones de disponibilité. Grâce à ses fonctionnalités automatisées de sauvegarde interrégionale et de reprise d'activité, les données sont disponibles même en cas de corruption ou de catastrophe régionale.
  • Espace de noms unique. FSx pour ONTAP résout le problème de namespaces qui se produit lorsque les données sont stockées à plusieurs emplacements. Les données peuvent être consolidées et accessibles via un namespace unique, sans nécessiter de consolidation d'infrastructure.
  • Coûts de stockage réduits. La mise en cache des données avec FSx pour ONTAP permet d'économiser de l'espace, car elle met en cache uniquement les données actives, et non les copies complètes. De plus, les fonctionnalités d'efficacité de stockage intégrées de FSx pour ONTAP fonctionnent avec la mise en cache intelligente des fichiers. Cela réduit à la fois les coûts de stockage et de transfert.

Comment un fabricant collabore sur AWS avec FSx pour ONTAP 

Un fabricant européen d'équipements de circuits imprimés (PCB) utilise les capacités de mise en cache de données de FSx pour ONTAP. Il est présent dans plus de 40 pays.

Avec des données dans le cloud dispersées dans l’Union européenne, aux États-Unis et en Asie-Pacifique, l’entreprise rencontrait des problèmes de latence et de productivité. Les équipes réparties sur plusieurs sites ROBO ne pouvaient pas collaborer efficacement sur les mêmes données.

FSx pour ONTAP avec Global File Cache a résolu les problèmes de latence sur les emplacements ROBO et a fourni plusieurs autres avantages :

  • Accès mondial aux fichiers. L'intégration avec les namespaces du système de fichiers distribués (DFS-N) préserve les namespaces et les listes de contrôle d'accès (ACL). Cela signifie que les employés peuvent accéder aux fichiers stockés sur n’importe lequel des systèmes de fichiers FSx pour ONTAP dans les centres mondiaux comme s’ils étaient stockés localement.
  • Verrouillage de fichiers. Cette fonctionnalité permet aux équipes de l'entreprise de collaborer sur des fichiers de projet partagés sans apporter de modifications conflictuelles et améliore la productivité des équipes situées dans le monde entier.
  • Facilité d'un service entièrement géré. Les ressources sous-jacentes, les mises à jour logicielles et la maintenance sont toutes gérées par AWS, ce qui vous décharge de la charge opérationnelle. De même, GFC est un module complémentaire simple qui ne nécessite aucune formation particulière de l'utilisateur final.
  • Économies grâce à plusieurs facteurs :
    • FSx pour ONTAP applique des efficacités de stockage et un tiering des données peu utilisées qui réduisent les coûts globaux de stockage des fichiers partagés.
    • Chaque instance GFC met en cache uniquement les fichiers fréquemment consultés sur ce site périphérique et, chaque fois qu'un fichier est modifié, seuls les blocs modifiés sont transférés. Cette approche génère un trafic de données et des coûts de transfert de sortie minimes.
    • Les partages de fichiers FSx pour ONTAP sont protégés à l'aide de la technologie économique NetApp Snapshot. Vous n’avez pas besoin de mettre en œuvre des solutions de protection des données supplémentaires sur les sites périphériques.

Rassemblez vos données et vos équipes avec FSx pour ONTAP

Vos équipes ont besoin d’un moyen de collaborer sur l’ensemble de votre patrimoine de données sans subir de retards ni créer de silos de données qui augmentent les coûts et nuisent à l’intégrité des données. Pour un parc de données diversifié, il est facile de le faire avec FSx pour ONTAP.

FSx pour ONTAP utilise des fonctionnalités optimisées par les technologies NetApp FlexCache et GFC pour fournir la mise en cache de données en tant que partie intégrante d'un service AWS propriétaire.

Créez des architectures de données distribuées fiables, maintenez vos utilisateurs synchronisés et gardez la maîtrise les coûts.

Pour plus d'informations, consultez Mise en cache des données à l'aide d' Amazon FSx pour NetApp ONTAP.

Drift chat loading