NetApp Tech OnTap
     

Datenkomprimierung für NetApp Storage

Effizienz ist der Schlüssel zu flexibler IT. Als einer der führenden Entwickler von Storage-Effizienz-Technologien arbeitet NetApp beständig an Effizienz-Innovationen wie Snapshot und den zugehörigen Technologien, Thin Provisioning, FlexClone, Deduplizierung für Primärspeicher und vielem mehr.

Datenkomprimierungstechnologien gibt es bereits seit langem, doch bringen diese erhebliche Herausforderungen an die Storage-Systeme mit sich. An erster Stelle sind hier die Performance-Beeinträchtigungen zu nennen. Bis vor kurzem wurde die Komprimierung für Komponenten wie Bandlaufwerke und VTLs fast immer mithilfe von dedizierter Hardware bereitgestellt, die mehr Kosten und Komplexität bedeutet. Jetzt hat NetApp eine Möglichkeit entwickelt, transparente Inline-Datenkomprimierung innerhalb der Software zu bieten. Zugleich werden die Auswirkungen auf die Computing-Ressourcen verringert. Hierdurch können wir die Vorteile der Komprimierung in Data ONTAP ohne Aufpreis zur Verfügung stellen, sodass Sie diese in bestehenden NetApp Storage-Systemen, die auf Data ONTAP 8.0.1 oder höher aktualisiert werden, nutzen können.

In diesem Artikel möchte ich erläutern, was NetApp Datenkomprimierung ist, und wie sie funktioniert. Ich werde auf einige gängige Anwendungsfälle sowie auf die erzielten Platzeinsparungen eingehen. Zudem werde ich darlegen, wie die Datenkomprimierung zusammen mit anderen NetApp Technologien eingesetzt werden kann, und wie NetApp Sie dabei unterstützt, diese neue Funktion erfolgreich zu nutzen.

Was ist NetApp Datenkomprimierung?


NetApp Datenkomprimierung ist eine ohne Aufpreis erhältliche Option, die als softwarebasierte Lösung für transparente Inline-Datenkomprimierung in Data ONTAP 8.0.1 integriert ist. Zur Nutzung der NetApp Datenkomprimierung sind keine Änderungen an Applikationen erforderlich.

NetApp Datenkomprimierung kann die zur Datenspeicherung benötigte physische Storage-Kapazität verringern. Hierzu werden Daten in einem flexiblen Volume (FlexVol) im Primär- und Sekundärspeicher sowie im Archiv-Storage komprimiert. Komprimiert werden können herkömmliche Dateien, virtuelle lokale Festplatten und LUNs. (Im weiteren Verlauf dieses Artikels gelten Verweise auf Dateien auch für virtuelle lokale Festplatten und LUNs.)

Bei der NetApp Datenkomprimierung wird eine Datei nicht vollständig als einzelner zusammenhängender Byte Stream komprimiert. Dies wäre bei der Bearbeitung wenig umfangreicher Lesevorgänge aus einem Teil der Datei einfach viel zu teuer, da hierzu vor der Erfüllung der Leseanforderung die ganze Datei von der Festplatte gelesen und dekomprimiert werden müsste. Besonders schwierig wäre dies bei großen Dateien. Zur Vermeidung dieses Szenarios wird bei der NetApp Datenkomprimierung jeweils eine kleine Gruppe aufeinander folgender Blöcke komprimiert. Dies ist ein wesentliches Design-Element, das die NetApp Datenkomprimierung besonders effizient macht. Wenn eine Leseanforderung eingeht, muss statt der ganzen Datei nur eine kleine Gruppe von Blöcken dekomprimiert und gelesen werden. Hierdurch werden die Lesevorgänge optimiert. Zudem lässt sich die Größe der komprimierten Dateien besser skalieren.

Der Komprimierungsalgorithmus von NetApp teilt eine Datei in Datenblöcke von jeweils 32 KB auf, die als Komprimierungsgruppen bezeichnet werden. Jede Komprimierungsgruppe enthält Daten aus nur einer Datei.

Schreiben von Daten: Schreibanforderungen werden auf der Ebene der Komprimierungsgruppen bearbeitet. Nach der Bildung einer Gruppe wird ein Test ausgeführt, während sich die Daten noch im Speicher befinden, um festzustellen, ob die Daten komprimierbar sind. Falls nicht, werden sie nur an die Festplatte durchgeleitet. Nur wenn aus dem Test hervorgeht, dass die Daten komprimierbar sind, wird die gesamte Gruppe komprimiert. So werden optimale Platzeinsparungen erzielt und der Ressourcen-Overhead minimiert.

Da komprimierte Daten weniger Blöcke enthalten, die auf die Festplatte geschrieben werden, sinkt die Anzahl der für jeden komprimierten Schreibvorgang erforderlichen Schreib-I/Os. Dies verringert nicht nur den auf der Festplatte erforderlichen Platzbedarf, sondern kann auch den Zeitaufwand bis zur vollständigen Verarbeitung von Schreibanforderungen senken. Auch Backups werden in erheblich kürzerer Zeit ausgeführt.

Erst nach dem Komprimierbarkeitstest findet eine Komprimierung statt. Anschließend werden die Komprimierungsgruppen – je nach Testergebnis komprimiert oder unkomprimiert – auf der Festplatte gespeichert.

Abbildung 1) Erst nach dem Komprimierbarkeitstest findet eine Komprimierung statt. Anschließend werden die Komprimierungsgruppen – je nach Testergebnis komprimiert oder unkomprimiert – auf der Festplatte gespeichert.

Lesen von Daten: Wenn eine Leseanforderung für komprimierte Daten eingeht, liest Data ONTAP statt der gesamten Datei nur die Komprimierungsgruppen, die die angeforderten Daten enthalten. Dies minimiert die Anzahl der zur Verarbeitung der Anforderung erforderlichen I/O-Vorgänge sowie den Overhead.

Komprimierungs-Performance


Die NetApp Datenkomprimierung ist darauf ausgelegt, entweder unabhängig oder – zur Erzielung maximaler Einsparungen – in Verbindung mit der NetApp Deduplizierung eingesetzt zu werden. Die NetApp Deduplizierung lässt sich für einen bestimmten Zeitpunkt planen, während die NetApp Datenkomprimierung als Inline-Prozess ausgeführt wird, sobald Daten auf die Festplatte geschrieben werden. Wenn beide Funktionen auf demselben Volume aktiviert sind, werden die Daten zuerst komprimiert und anschließend dedupliziert. Für die Deduplizierung müssen keine Daten dekomprimiert werden. Es werden lediglich mehrfach gespeicherte, komprimierte oder unkomprimierte Blöcke aus dem Daten-Volume entfernt.

Die Datenkomprimierung nutzt die internen Merkmale von Data ONTAP und ist somit äußerst effizient. Obwohl sie nur minimale Performance-Beeinträchtigung verursacht, beseitigt sie diese jedoch nicht ganz. Sie müssen daher Ihre Workloads auf Toleranz gegenüber den zur Durchführung der Datenkomprimierung benötigten Ressourcen überprüfen. Die tatsächliche Beeinträchtigung kann von folgenden Faktoren abhängen:

  • Applikationstyp
  • Komprimierbarkeit des Datensatzes
  • Datenzugriffsmuster (beispielsweise sequentieller bzw. direkter Zugriff, I/O-Größe
    und -Muster)
  • durchschnittliche Dateigröße
  • Änderungsrate
  • Anzahl der Volumes, für die die Komprimierung aktiviert ist
  • Hardware-Plattform – CPU-/Speichergröße im System
  • Systemlast
  • Festplattentyp und -geschwindigkeit
  • Anzahl der Spindeln im Aggregat

Wir haben Best Practices entwickelt, die Ihnen bei der Größenbemessung und anderen Aktivitäten zur Optimierung Ihrer Implementierung helfen. Aufgrund der vielen Faktoren, die eine Rolle spielen können, sollten Sie in Ihrer Umgebung Tests durchführen, um festzustellen, ob sich die Datenkomprimierung für den von Ihnen gewünschten Zweck eignet. In den folgenden Abschnitten werde ich die Einsparungen aufzeigen, die bei verschiedenen Applikations-Datensätzen sowie einigen typischen Anwendungsfällen gemessen wurden.

Platzeinsparungen durch Datenkomprimierung und Deduplizierung


Die NetApp Datenkomprimierung sorgt durch Inline-Komprimierung für sofortige Platzeinsparungen. Die NetApp Deduplizierung hingegen wird nachfolgend in regelmäßigen Abständen ausgeführt und ermöglicht so kumulierte Platzeinsparungen. Komprimierung und Deduplizierung ergänzen sich, jedoch sind die erzielten Einsparungen nicht notwendigerweise die Summe der Einsparungen, die sich mit einer separaten Ausführung der Technologien erzielen lassen.

Bei einigen Datentypen führt Komprimierung nicht zu gesteigerten Einsparungen im Vergleich zur alleinigen Anwendung von Deduplizierung. In anderen Fällen trifft das Gegenteil zu. In wieder anderen Fällen führt eine Kombination aus Komprimierung und Deduplizierung zu den größten Storage-Einsparungen. Die Beispiele in der folgenden Tabelle veranschaulichen dies.

Tabelle 1) Beste Kombination zur Erzielung von Platzeinsparungen für verschiedene Datentypen

Datensatz-Typ Applikation Beste Kombination für Einsparungen Typische Platzeinsparungen
Home Directorys Komprimierung + Deduplizierung 65 %
Virtuelle Server und Desktops nur Deduplizierung 70 %
Datenbanken nur Komprimierung 65 %
E-Mail Exchange 2003/2007 nur Komprimierung 35 %
Exchange 2010 Komprimierung + Deduplizierung 40 %
Engineering-Daten Softwareentwicklung Komprimierung + Deduplizierung 75 %
Geoseismik nur Komprimierung 75 %

Dies sind typische Einsparungsbeispiele, sie sind jedoch nicht bei allen Datensätzen gleich. Führen Sie Tests für Ihre Daten durch, um die zu erwartenden Einsparungen zu ermitteln. NetApp ist Ihnen jederzeit gern bei diesem Evaluierungsprozess behilflich.

Typische Anwendungsfälle


Wie bereits erläutert, sind mit Komprimierung beträchtliche Storage-Einsparungen möglich, die jedoch gewisse Performance-Beeinträchtigungen mit sich bringen. Es ist wichtig, beide Aspekte gegeneinander abzuwägen, um herauszufinden, in welchen Fällen Komprimierung in Ihrer Storage-Umgebung am sinnvollsten ist.

So eignen sich Datenbank-Backups (und Backups allgemein) potenziell optimal für die Datenkomprimierung. Datenbanken sind häufig extrem groß, und es gibt viele Benutzer, die für Kapazitätseinsparungen von über 65 % leichte Performance-Einbußen gern in Kauf nehmen.

Einen weiteren möglichen Anwendungsfall bilden File Services. Bei Tests mit einem File Services Workload in einem System, das zu etwa 50 % ausgelastet war, und mit einem um 50 % komprimierbaren Datensatz kam es bei unseren Messungen nur zu einem um 10 % niedrigeren Durchsatz. In einer File Services-Umgebung mit Antwortzeiten von zwei Millisekunden für Dateien würde dies eine Verlängerung um nur 0,2 Millisekunden bedeuten, sodass die Antwortzeiten auf 2,2 Millisekunden steigen würden. Für eine Platzeinsparung von 65 % ist diese leichte Performance-Einbuße für Sie möglicherweise akzeptabel. Darüber hinaus können noch weitere Einsparungen erzielt werden, indem die Daten mit der NetApp SnapMirror Technologie für Volumes repliziert werden, wodurch Sie Netzwerkbandbreite und Platz auf dem Sekundärspeicher einsparen (der Sekundärspeicher wird in diesem Fall ebenso komprimiert wie der Primärspeicher, sodass keine zusätzliche Bearbeitung erforderlich ist). Dieses Szenario führt zu folgenden Ergebnissen:

  • 65 % Storage-Kapazitätseinsparungen auf dem Primärspeicher
  • 65 % weniger Daten, die zur Replizierung über das Netzwerk gesendet werden
  • 65 % schnellere Replizierung
  • 65 % Storage-Kapazitätseinsparungen auf dem Sekundärspeicher

Es gibt noch viele andere Anwendungsfälle, in denen eine Komprimierung sinnvoll ist. Wir bieten Ihnen eine Reihe von Tools und Anleitungen, mit denen Sie leichter entscheiden können, welche Anwendungen für Ihre Umgebung am besten geeignet sind.

Verwendung der Datenkomprimierung mit anderen NetApp Technologien


Wie bereits gesagt, ergänzen sich NetApp Datenkomprimierung und NetApp Deduplizierung gegenseitig. Im folgenden Abschnitt gehe ich nun auf die Kombination von Datenkomprimierung mit einigen weiteren gängigen NetApp Technologien ein.

Volume SnapMirror: Volume SnapMirror wird auf der physischen Blockebene ausgeführt. Wenn Deduplizierung und/oder Komprimierung auf dem Quell-Volume aktiviert sind, bleiben die Platzeinsparungen, die auf Deduplizierung und Komprimierung zurückzuführen sind, im Netzwerk und auf dem Zielsystem erhalten. Dies kann die während der Replizierung erforderliche Netzwerkbandbreite sowie die Dauer der SnapMirror Übertragung erheblich verringern. Berücksichtigen Sie folgende allgemeine Richtlinien:

  • Quell- und Zielsystem müssen identische Versionen von Data ONTAP nutzen.
  • Komprimierung und Deduplizierung werden nur auf dem Quellsystem gemanagt. Das flexible Volume im Zielsystem übernimmt die Effizienzmerkmale und Storage-Einsparungen.
  • Gemeinsam genutzte Datenblöcke werden nur einmal übertragen. Die Deduplizierung verringert also auch die Netzwerkbandbreite.
  • Die Komprimierung wird während der gesamten Übertragung beibehalten. Die Menge der übertragenen Daten wird dabei reduziert, sodass auch die verwendete Netzwerkbandbreite sinkt.
  • Es ist keine SnapMirror Linkkomprimierung erforderlich, da die Daten bereits bereits komprimiert wurden.

Die Reduzierung der Netzwerkbandbreite sowie der SnapMirror Übertragungszeit ist direkt proportional zu den Platzeinsparungen. Wenn Sie beispielsweise 50 % der Festplattenkapazität einsparen, sinkt die SnapMirror Übertragungszeit um 50 %, und die Menge der zu übertragenden Daten halbiert sich ebenfalls.

qtree SnapMirror und SnapVault: qtree SnapMirror und SnapVault werden beide auf der logischen Blockebene ausgeführt. Deduplizierung und Datenkomprimierung laufen unabhängig voneinander auf Quell- und Zielsystem. Hierdurch können Sie Ihre qtree SnapMirror und/oder SnapVault Backups komprimieren und/oder deduplizieren, selbst wenn die Quelldaten nicht komprimiert oder dedupliziert wurden.

Klonen: Die NetApp FlexClone Technologie erstellt sofort virtuelle Kopien von Dateien oder Daten-Volumes – Kopien, die erst dann zusätzlichen Speicherplatz erfordern, wenn die Klone geändert werden. FlexClone unterstützt sowohl Deduplizierung als auch Komprimierung.

Erste Schritte mit der NetApp Datenkomprimierung


Die NetApp Datenkomprimierung funktioniert auf allen NetApp FAS und V-Series Systemen mit Data ONTAP 8.0.1 und höher. Die Datenkomprimierung wird auf Volume-Ebene aktiviert. Dies bedeutet, dass Sie festlegen, auf welchen Volumes sie ausgeführt wird. Wenn Sie wissen, dass ein Volume nicht komprimierbare Daten enthält, müssen bzw. sollten Sie die Komprimierung auf diesem Volume nicht aktivieren. Ein Volume kann eine Größe von bis zu 16 TB aufweisen und muss Bestandteil eines 64-Bit-Aggregats sein (diese wurden mit Data ONTAP 8 eingeführt). Weitere Informationen zu Data ONTAP 8 finden Sie in einem weiteren Artikel dieser Ausgabe von Tech OnTap.

Um die Datenkomprimierung zu nutzen, installieren Sie einfach die kostenlose Lizenz auf Ihrem Storage-System und aktivieren Sie sie dann auf den gewünschten Volumes. So leicht ist das.

Datenkomprimierungsprogramm für erste Anwender: Ähnlich wie bei der Einführung der Deduplizierung vor einigen Jahren ermöglichen wir einen frühzeitigen Zugriff auf unsere Datenkomprimierungstechnologie. Wenn Sie die Komprimierungslizenz beantragen, evaluieren wir Ihre Umgebung und geben Ihnen unsere Best Practices-Empfehlungen.

Schlussfolgerung

Mit der NetApp Datenkomprimierung knüpfen wir an die Tradition an, Data ONTAP mit zusätzlichen Storage-Effizienz-Funktionen ohne Mehrkosten auszustatten. Die Technologie senkt den Storage-Bedarf für komprimierbare Zieldatensätze und kann in Verbindung mit NetApp Deduplizierung und anderen NetApp Technologien eingesetzt werden.

Die Leistungsfähigkeit und das Potenzial der Komprimierung zahlen sich in Kombination mit anderen NetApp Storage-Effizienztechnologien noch mehr aus. Wählen Sie die geeignetsten Effizienztechnologien und -funktionen aus unserem integrierten Portfolio und passen Sie so Ihre Technologie wirksam und flexibel an Ihre Geschäftsanforderungen an.

NetApp Community
 Was halten Sie von Datenkomprimierung?

Stellen Sie Fragen, tauschen Sie Ideen aus und teilen Sie Ihre Meinung mit der NetApp Community!

Sandra Moulton

Sandra Moulton
Technical Marketing Engineer
NetApp

Seit ihrem Eintritt bei NetApp vor gut einem Jahr beschäftigt sich Sandra Moulton fast ausschließlich mit Storage-Effizienz und hat sich dabei auf Deduplizierung und Datenkomprimierung spezialisiert. Sie ist für die Erstellung von White Papers, Best Practice-Leitfäden und Referenzarchitekturen für diese wichtigen Technologien verantwortlich. Sandra verfügt über mehr als 20 Jahre Branchenerfahrung und bekleidete bereits ähnliche Funktionen bei anderen führenden Unternehmen im Silicon Valley.

 
Weitere Infos hier