Menü

Besser zusammenarbeiten, überall: Daten-Caching mit Amazon FSx for NetApp ONTAP

Inhalt

Diese Seite teilen

Yifat Perry
Yifat Perry

Die ständig wachsenden Datenbestände und die verteilten Teams, die remote arbeiten, haben die Anforderungen an Daten verändert. Das schnelle Abrufen von Daten und die effektive Zusammenarbeit an freigegebenen Datensätzen in unterschiedlichen Umgebungen ist unerlässlich, unabhängig davon, wo die Daten gehostet werden.

Die Orchestrierung dieser Art der Datenverteilung kann ein Albtraum sein, da Probleme mit der Datenintegrität, Inkompatibilität und Leistung zu Schwierigkeiten führen. Organisationen benötigen Möglichkeiten, den Datenzugriff zu beschleunigen und die Datenflexibilität und Zusammenarbeit ohne diese Herausforderungen zu fördern.

NetApp und AWS haben sich zusammengeschlossen, um die Lösung hierfür anzubieten: Daten-Caching mit Amazon FSx for NetApp ONTAP. In diesem Beitrag werden die Daten-Caching-Funktionen von FSx for ONTAP untersucht, die dabei helfen, die Herausforderungen der Arbeit mit global verteilten Daten zu bewältigen.

Lesen Sie weiter, um alle Einzelheiten zu erfahren, oder verwenden Sie diese Links, um zu dem Abschnitt zu springen, der Sie interessiert:

Die komplexe Herausforderung verteilter Daten

Verteilte Daten stellen Unternehmen vor mehrere Herausforderungen, die sie bewältigen müssen:

  • Datenkonsolidierung. Wenn Daten über mehrere Standorte verteilt sind, müssen Sie die Daten aus verschiedenen Quellen konsolidieren. Wenn Sie die Daten nicht kohärent als einzelnes Dateisystem anzeigen können, können Sie die Daten nicht effizient lesen und schreiben – oder sie analysieren, um daraus einen sinnvollen Geschäftswert abzuleiten.
  • Mehrere Namespaces. Das Fehlen kohärenter Namespaces für Daten aus unterschiedlichen Quellen erhöht die Komplexität zusätzlich. Um konsistent auf Daten zugreifen und sie verwenden zu können, müssen Sie die verschiedenen Namenskonventionen und Strukturen vereinheitlichen. Dieser Prozess kann jedoch einen intensiven Aufwand erfordern.
  • Leistungseinbußen. Es kann schwierig sein, allen Benutzern Daten zur Verfügung zu stellen, ohne dass dabei die Leistung nachlässt. Je weiter Benutzer vom Datensatz entfernt sind, desto mehr Latenz erfahren sie.
    Sie benötigen ein ausgewogenes Verhältnis zwischen Zugriff mit geringer Latenz, optimierter Bandbreite und Kosten. Das Erstellen von Datensilos über verschiedene Umgebungen und Regionen hinweg ist keine Lösung. Obwohl es lokalen Benutzern einen schnelleren Zugriff auf die Daten ermöglicht, verursacht es Synchronisierungsprobleme.
  • Datenreplikation. Daten, die über mehrere Umgebungen hinweg repliziert werden, müssen konsistent und aktuell sein. Das größte Risiko besteht darin, dass bei der Replikation Unstimmigkeiten auftreten können, die zu mangelnder Datenintegrität führen können.
  • Kostensteigerungen. Die verteilte Natur von Edge- und Cloud-Systemen bringt einige kostenbezogene Herausforderungen mit sich. Möglicherweise verfügen Sie am Ende über unterschiedliche vollständige Kopien der Daten an unterschiedlichen Standorten, für die Sie bezahlen müssen. Sie müssen über die Verwaltung der mit der Datenübertragung und der zentralen Verwaltung verbundenen Kosten nachdenken.

Die Bewältigung der Komplexität der Arbeit mit verteilten Daten kann eine große Herausforderung darstellen. Hier kann FSx for ONTAP helfen.

Daten-Caching mit FSx for ONTAP

FSx for ONTAP ist der vollständig verwaltete Storage-Service von AWS, der vertrauenswürdige NetApp® ONTAP® Datenmanagementlösungen bereitstellt.

FSx for ONTAP ist mit Daten-Caching-Funktionen ausgestattet, die einen schnelleren Zugriff auf Daten und eine nahtlose Zusammenarbeit in Echtzeit über mehrere Umgebungen hinweg ermöglichen. FSx for ONTAP erreicht dies auf zwei Arten: durch die Konsolidierung von Daten am Edge und durch das lokale Zwischenspeichern (Caching) beschreibbarer Datenkopien.

Datenkonsolidierung am Edge

FSx for ONTAP unterstützt Unternehmen bei der Konsolidierung unstrukturierter Daten für High-Performance-Nutzererfahrung, betriebliche Effizienz und Zusammenarbeit im großen Maßstab durch die Verwendung von NetApp Global File Cache (GFC) Technologie. FSx for ONTAP speichert nur die Daten im Cache, die an den jeweiligen Standorten benötigt werden, und verwendet das Server Message Block (SMB)-/Common Internet File System (CIFS)-Protokoll. Für den Benutzer ist es transparent, die Zusammenarbeit über GFC fühlt sich an, als würde man mit lokalen Dateien arbeiten.

GFC kann Hybrid-Cloud-Architekturen unterstützen, die aus lokalen ONTAP und FSx for ONTAP Systemen bestehen, indem es eine zentralisierte Storage-Lösung mit einem verteilten Datencache an Edge-Standorten bereitstellt. Ihre Benutzer auf der ganzen Welt können auf diesen einzelnen Datensatz zugreifen, mit Skalierbarkeit bis in den Petabyte-Bereich.

Da häufig verwendete Daten zwischengespeichert werden, erzielen Sie eine bessere Performance für kollaborative Apps. Die intelligente Dateisperrfunktion gewährleistet die Datenintegrität, auch wenn über einen globalen Namespace von mehreren Standorten aus auf die Daten zugegriffen wird.

Bild1 12. März 2024 12 01 20 2948 PMNetApp Global File Cache – High-Level-Architektur

Vollständig beschreibbare gecachte Daten an entfernten Standorten

Mit FSx for ONTAP können Sie an einem Remote-Standort einen beschreibbaren, persistenten Cache mit der neuesten, konsistentesten und kohärentesten Kopie Ihrer Daten erstellen. Diese dünn besiedelten, beschreibbaren Cache-Volumes können verwendet werden, um einen Cache auf demselben oder einem anderen System für einen schnelleren Datenzugriff zu erstellen. NetApp FlexCache® Technologie macht es möglich.

FlexCache1FlexCache in FSx for ONTAP.

Auf die zwischengespeicherten Daten kann über das Network File System (NFS) und SMB/CIFS zugegriffen werden. Dies bedeutet, dass Sie die Cache-Daten verwenden können, ohne Ihre Systeme in irgendeiner Weise neu zu strukturieren. Diese Daten sind in leseintensiven Umgebungen von Vorteil, in denen Daten von mehreren Hosts gemeinsam genutzt und mehr als einmal abgerufen werden.

Um die Größe der zwischengespeicherten Datenkopie zu optimieren, werden nur die vom Client gelesenen Daten zwischengespeichert. Clients können jedes beliebige Volume mounten, um von mehreren Standorten aus auf dieselben vorab ausgefüllten, aktuellen Daten zuzugreifen. Das zwischengespeicherte Volume fungiert als temporärer Speicherort zwischen einem Host und der Datenquelle und speichert die häufig abgerufenen Datenblöcke, sodass diese schneller bereitgestellt werden können als durch Abrufen von der Quelle.

FlexCache2Cache-Kopien verweisen auf relevante Datenblöcke in den Quelldaten, um die Größe der Kopie zu optimieren.

Anwendungsfälle für Daten-Caching mit FSx for ONTAP

Daten-Caching mit FSx for ONTAP kann in einer Vielzahl von Szenarien hilfreich sein:

  • Remote-Office- oder Zweigstellenstandorte (ROBO)
  • High-Performance-Computing-Workloads (HPC)
  • Anwendungsfälle für künstliche Intelligenz/maschinelles Lernen (KI/ML) und Deep Learning (DL)
  • Cloud-Bursting

Vorteile der Verwendung von FSx for ONTAP und Daten-Caching

Mit FSx for ONTAP verfügen Sie über eine Lösung mit geringem Overhead für alle Ihre Daten-Caching-Anforderungen:

  • Schneller Zugriff auf Remote-Daten. Durch das Daten-Caching sind Remote-Daten näher am Benutzer verfügbar – mit minimalen oder keinen zusätzlichen Architekturanforderungen.
  • Hohe Performance. Durch das Daten-Caching mit FSx for ONTAP werden die Latenzprobleme beim Zugriff auf Daten aus aller Welt eliminiert – ohne Kompromisse bei der Datenintegrität oder -qualität.
  • Dateisperre. Der Dateisperrmechanismus von FSx for ONTAP verhindert parallele Schreibvorgänge, die zu Problemen mit der Datenintegrität führen könnten.
  • Zero-Touch-Einrichtung. Datensätze in allen verschiedenen Umgebungen, sowohl zwischengespeichert als auch am Ursprung, werden von FSx for ONTAP mühelos konsistent gehalten.
  • Datenschutz und Ausfallsicherheit. FSx for ONTAP ist standardmäßig hochverfügbar und belastbar und verwendet entweder eine oder mehrere Verfügbarkeitszonen, um die Uptime aufrechtzuerhalten. Dank der automatisierten regionsübergreifenden Sicherungs- und Notfallwiederherstellungsfunktionen sind die Daten auch dann verfügbar, wenn es zu Beschädigungen oder regionalen Katastrophen kommt.
  • Einzelner Namespace. FSx for ONTAP löst das Namespace-Problem, das auftritt, wenn Daten an mehreren Orten gespeichert werden. Daten können konsolidiert und über einen einzigen Namespace abgerufen werden, ohne dass eine Infrastrukturkonsolidierung erforderlich ist.
  • Reduzierte Storage-Kosten. Das Daten-Caching mit FSx for ONTAP spart Speicherplatz, da nur aktive Daten und keine vollständigen Kopien zwischengespeichert werden. Darüber hinaus arbeiten die integrierten Storage-Effizienzfunktionen von FSx for ONTAP mit intelligentem Datei-Caching. Dadurch werden sowohl die Speicher- als auch die Übertragungskosten reduziert.

Wie ein Hersteller die Zusammenarbeit auf AWS mit FSx for ONTAP bewältigt

Ein Unternehmen, das die Daten-Caching-Funktionen von FSx for ONTAP nutzt, ist ein europäischer Hersteller, der sich auf die Produktion von Geräten für Leiterplatten (PCB) konzentriert. Seine weltweiten Niederlassungen befinden sich in über 40 Ländern.

Da die Daten in der Cloud jedoch über die Europäische Union, die USA und den asiatisch-pazifischen Raum verteilt waren, kam es im Unternehmen zu Latenz- und Produktivitätsproblemen. Über mehrere ROBO-Standorte verteilte Teams konnten nicht effektiv an denselben Daten zusammenarbeiten.

FSx for ONTAP mit Global File Cache löste die Latenzprobleme an den ROBO-Standorten und bot mehrere weitere Vorteile:

  • Globaler Zugriff auf Dateien. Durch die Integration mit Distributed File System Namespaces (DFS-N) bleiben Namespaces und Zugriffskontrolllisten (ACLs) erhalten. Dies bedeutet, dass Mitarbeiter auf Dateien zugreifen können, die auf einem der FSx for ONTAP Dateisysteme in den globalen Zentren gespeichert sind, als wären sie lokal gespeichert.
  • Dateisperre. Diese Funktion ermöglicht es den Teams des Unternehmens, an freigegebenen Projektdateien zusammenzuarbeiten, ohne widersprüchliche Änderungen vorzunehmen, und verbessert die Produktivität der Teams auf der ganzen Welt.
  • Die Einfachheit eines vollständig verwalteten Services. Die zugrunde liegenden Ressourcen, Software-Updates und die Wartung werden alle von AWS übernommen, sodass Sie sich nicht um den Betriebsaufwand kümmern müssen. Ebenso ist GFC ein einfaches Add-on, das keine spezielle Endbenutzerschulung erfordert.
  • Kosteneinsparungen durch mehrere Faktoren:
    • FSx for ONTAP wendet Storage-Effizienz und Cold Data Tiering an, die die Gesamtkosten für die Speicherung gemeinsam genutzter Dateien senken.
    • Jede GFC-Instanz speichert nur die Dateien im Cache, auf die am häufigsten zugegriffen wird, und wenn eine Datei geändert wird, werden nur die geänderten Blöcke übertragen. Dieser Ansatz führt zu minimalem Datenverkehr und minimalen Kosten für die ausgehende Übertragung.
    • FSx for ONTAP Dateifreigaben werden durch kostengünstige NetApp Snapshot Technologie geschützt. Sie müssen an den Edge-Standorten keine zusätzlichen Datenschutzlösungen implementieren.

Bringen Sie Ihre Daten und Teams mit FSx for ONTAP zusammen

Ihre Teams benötigen eine Möglichkeit zur Zusammenarbeit über Ihren gesamten Datenbestand hinweg, ohne dass es zu Verzögerungen kommt oder Datensilos entstehen, die die Kosten in die Höhe treiben und die Datenintegrität beeinträchtigen. Bei einem vielfältigen Datenbestand ist dies mit FSx for ONTAP ganz einfach.

FSx for ONTAP verwendet Daten-Caching-Funktionen auf Basis der NetApp FlexCache und GFC-Technologien, um Daten-Caching als nahtlosen Teil eines First-Party-AWS-Dienstes bereitzustellen.

Erstellen Sie zuverlässige verteilte Datenarchitekturen, halten Sie Ihre Benutzer auf dem gleichen Stand und verhindern Sie, dass die Kosten außer Kontrolle geraten.

Weitere Informationen finden Sie unter Caching von Daten mit Amazon FSx for NetApp ONTAP.

Drift chat loading