NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
FAS6200 Cluster liefert herausragende Block-I/O-Performance mit niedriger Latenz
Dimitris Krekoukias
Systems Engineer

Die NetApp Data ONTAP 8 Software in Cluster-Mode ist die branchenweit einzige horizontal skalierbare Unified Storage-Plattform, die NAS- und SAN-Protokolle im gleichen Cluster unterstützt. In einem anderen Artikel dieser Ausgabe von Tech OnTap wird eine Fallstudie einer Cluster-Mode-Implementierung durch einen schnell wachsenden Anbieter behandelt. In früheren Tech OnTap Artikeln wurden die Funktionen von Cluster-Mode, und die Performance- und Skalierbarkeitsergebnisse beim SPECsfs NFS Benchmark-Test erläutert. Ein Cluster von 24 FAS6240 Systemen erreichte über 1,5 Millionen Low-Latency SPECsfs2008_nfs.v3 OPs/s.

Die beeindruckende File Service-Performance von Cluster-Mode hat natürlich das Interesse für die Performance von Block-Workloads geweckt. NetApp hat sich zu einem SPC-1 Benchmark-Test für ein FAS6240 Cluster mit sechs Nodes verpflichtet und diesen kürzlich eingereicht. Darin haben wir 250.000 SPC-1 IOPS demonstriert (der Cluster bestand aus einigen derselben Komponenten wie bei unserem SPECsfs Test). Aufgrund des hohen IOPS-Werts und der niedrigen Latenz ist dieses Ergebnis eines der besten SPC-1 Ergebnisse für ein festplattenbasiertes Enterprise Storage-System.

Überblick über die Architektur von PeakColo.

Abbildung 1) SPC-1 IOPS für ein NetApp FAS6240 Cluster mit sechs Nodes.

In diesem Artikel beschäftige ich mich mit der SPC-1 Benchmark und der Bedeutung der Latenz. Außerdem gehe ich genauer auf aktuelle Ergebnisse von NetApp und anderen Anbietern ein und vergleiche festplattenbasierten und Flash-basierten Storage miteinander.

Die SPC-1 Benchmark

Der Storage Performance Council (SPC) ist ein Konsortium von Storage-Anbietern, Integratoren und akademischen Einrichtungen, dessen Aufgabe darin besteht, Storage Benchmarks zu definieren, zu standardisieren und zu fördern. Die SPC-1 Benchmark des Storage Performance Council ist eine branchenübliche, geprüfte, komplexe blockbasierte Benchmark mit Schwerpunkt auf Festplatten-Subsystemen und verschiedenen I/O-Operationen, darunter Schreibzugriffe, Überschreibungen, Schreibzugriff nach Lesezugriff, Lesezugriff nach Schreibzugriff, Engpässe sowie zufällige und sequenzielle Operationen. Insgesamt 60 % des Workloads besteht aus Schreibzugriffen, wodurch hohe Anforderungen an Storage-Systeme gestellt werden. Die I/O-Größe ändert sich von kleinen zu großen Umgebungen.

SPC-1 gilt als die beste verfügbare Benchmark, um zu modellieren, wie Datenbanken Storage-Systeme belasten. Bei der Entwicklung der Benchmark untersuchte SPC, wie verschiedene Applikationen auf Storage zugriffen, und entwickelte dann auf Basis der gemessenen Ergebnisse ein Modell für den Workload. Die verschiedenen Operationen sind repräsentativ für ein breites Spektrum an Applikationen und ungefähr die Hälfte aller kommerziellen Applikationen.

Die SPC-1 Zugriffsmuster führen zu Engpässen, die einen großen Anteil des gesamten Workloads bilden. Diese Engpässe werden entweder teilweise im Cache gespeichert (wenn der Cache groß genug ist) oder auf SSD-Festplatten abgelegt, wenn der getestete Storage über ein automatisiertes Storage Tiering(AST)-System verfügt, das granular und intelligent genug ist.

Auch wenn keine Benchmark perfekt ist, ist die SPC-1 Benchmark wahrscheinlich die beste standardisierte Benchmark, um die zufällige Block-I/O-Performance zu messen und die Ergebnisse verschiedener Anbieter miteinander zu vergleichen. Wenn ein Storage System eine gute Performance bei der SPC-1 Benchmark aufweist, funktioniert es in der Regel auch äußerst gut bei schwierigen, latenzempfindlichen, sich dynamisch ändernden Workloads, wie Datenbank-Applikationen im Allgemeinen und OLTP im Speziellen, E-Mails und Virtualisierungen. Äußerst Interessierte können sich die vollständigen Spezifikationen durchlesen.

SPC-1 ist keine Durchsatz-Benchmark. Sie gibt keine Auskunft über maximale Gbit/s.

Auswertung von Benchmark-Ergebnissen

Die Kunst bei Benchmarks besteht in der Auswertung der Ergebnisse. Eine einzelne IOPS-Nummer besitzt unter Umständen keine umfassende Aussagekraft. Deshalb gilt es, verschiedene Aspekte bei der Auswertung eines SPC-1 Berichts zu beachten.

Nachhaltigkeit. Alle SPC-1 Benchmarks enthalten einen Nachhaltigkeitstest, der für mindestens acht Stunden durchgeführt werden muss. Achten Sie auf dauerhaft hohe IOPS. Die Performance sollte während des Intervalls nicht abnehmen, und je länger der Nachhaltigkeitstest durchgeführt wird desto besser.

IOPS/Laufwerk. Dieser Wert gibt an, wie effizient ein Storage-System mit der zugrunde liegenden Hardware umgeht. 500 IOPS/Laufwerk ist doppelt so effizient wie 250 IOPS/Laufwerk. Je effizienter Laufwerke genutzt werden, desto weniger Laufwerke sind erforderlich, um eine bestimmte Performance zu erzielen. Dies wiederum hat zur Folge, dass weniger Kosten entstehen und der physische Platzbedarf verringert wird.

Reaktionszeit (Latenz). Bei der Reaktionszeit der SPC-1 Benchmark wird gemessen, wie lange eine Applikation für eine durchschnittliche I/O-Transaktion benötigt. Je kürzer die Reaktionszeit, d. h. je schneller die Antwort, umso besser. Es ist möglich (aber nicht wünschenswert), hohe IOPS-Werte und kurze Reaktionszeiten zu erzielen. Bei Datenbanktransaktionen gilt eine Reaktionszeit von zehn Millisekunden als absoluter Höchstwert für eine gute Performance von Lesevorgängen (Datenbanken mit einer Reaktionszeit von mehr als 20 Millisekunden gelten bei Anbietern wie Microsoft als „beschädigt"). Schreibvorgänge müssen noch schneller erkannt werden und Schreibvorgänge für Wiederherstellungsprotokolle sollten nahezu augenblicklich erfolgen.

Aus diesem Grund ist NetApp bemüht, möglichst niedrige Latenzwerte zu erzielen. Mehr Informationen zu IOPS und zur Latenz finden Sie in meinem aktuellen Blog-Beitrag.

Kosten pro OP. Dieser Wert gibt an, wie viel Kosten pro Operation entstehen. Dafür wird im Wesentlichen der gesamte Systempreis durch die erzielten SPC-1 IOPS geteilt. Beachten Sie jedoch, dass einige Anbieter hierfür reduzierte Preise angeben, während andere Listenpreise aufführen, wodurch die Ergebnisse verzerrt werden können.

RAID-Schutz. Welche Art von RAID-Schutz wurde für den Test verwendet? Für die meisten SPC-1 Ergebnisse wird die Spiegelung verwendet (RAID 10 oder RAID 1+O), um den Paritäts-Overhead zu beseitigen. In der Praxis bedeutet das, dass Sie deutlich mehr für Festplatten ausgeben als für eine ähnliche nutzbare Kapazität mit Single Parity oder Dual Parity RAID.

Hardwarebedarf. Wie komplex ist die Hardware-Konfiguration? Welche Festplattentypen wurden verwendet? Handelt es sich um ein praxisnahes System oder um ein System, das ausschließlich der Erzielung guter Benchmark-Ergebnisse dient?

Das SPC-1 Ergebnis von NetApp

Das SPC-1 Ergebnis von NetApp ist oben in Abbildung 1 dargestellt. Wir haben einen Cluster von 6 FAS6240 Nodes (3 HA-Paare) mit je einem Flash Cache-Modul mit 512 GB (Standard im FAS6240) und insgesamt 432 Festplatten (15 SAS-Laufwerke mit 450 GB und 15.000 U/min, 72 pro Controller) verwendet.

Flash Cache ist Teil des NetApp Virtual Storage Tier (VST). Häufig benötigte Lesedaten werden automatisch auf Flash verschoben. Ein einziger FAS6240 Controller unterstützt bis zu 3 TB Flash Cache. Die standardmäßig im System enthaltene 512-GB-Karte pro Cluster Node ist im Vergleich mit einer typischen Datacenter-Konfiguration also keineswegs übertrieben.

Auch der Einsatz von nur 72 Laufwerken pro Controller ist durchaus knapp bemessen, da ein einziger FAS6240 Controller bis zu 1.440 Laufwerke unterstützt. Bei den Festplatten handelte es sich um SAS-Laufwerke mit 450 GB und 15.000 U/min. Zu beachten ist, dass für alle Tests RAID-DP, die Double-Parity RAID 6 Implementierung von NetApp, aktiviert war. Dies entspricht den normalen Verfahren für Kunden (RAID-DP ist der NetApp Standard). Tabelle 1 fasst die Ergebnisse des Benchmark-Tests hinsichtlich der zuvor aufgeführten Metriken zusammen.

Tabelle 1) NetApp Performance zu wichtigen SPC-1 Metriken.

NetApp FAS6240 6-Node Cluster
SPC-1 IOPS250.039,67
SPC-1 IOPS/Laufwerk579
Reaktionszeit (Latenz)3,35 ms
Kosten pro OP6,69 $ (zum Listenpreis)
RAID-SchutzRAID-DP (Dual Parity RAID 6)
Festplattenanzahl442
Controller6

Darüber hinaus haben der Nachhaltigkeitstest und der Wiederholbarkeitstest keine Verschlechterung der Performance über einen längeren Zeitraum ergeben. Sie werden im nächsten Abschnitt sehen, dass dies sehr gute Ergebnisse sind, insbesondere die IOPS-Werte mit kurzen Reaktionszeiten (Latenz).

Vergleich mit anderen branchenführenden SPC-1 Ergebnissen

Wir haben branchenführende festplattenbasierte SPC-1 Ergebnisse auf Basis eines Schwellwerts von ca. drei Millisekunden für die Reaktionszeit analysiert. Die Analyse hat ergeben, dass die NetApp SPC-1 Ergebnisse aufgrund der niedrigen Latenz der angegebenen IOPS zu den besten im Bereich von festplattenbasierten Enterprise-Systemen gehören. NetApp bietet mit einer Konfiguration auf Basis von überwiegend HDDs eine Performance auf nahezu Flash-Niveau.

Die Reaktionszeit von drei Millisekunden entspricht den Anforderungen anspruchsvoller Datenbankapplikationen mit niedriger Latenz, die beispielsweise von Finanzunternehmen verwendet werden. Sehr geringe I/O-Latenzzeiten ermöglichen bei den meisten Datenbank-Workloads deutlich bessere Datenbankfunktionen.

Lesen Sie die ausführliche Analyse (und Anmerkungen) in meinem aktuellen Blog-Beitrag zu diesen Ergebnissen.

Wir haben die folgenden Storage-Systeme miteinander verglichen (die nachstehenden Hyperlinks führen zu den kompletten SPC-1 Benchmark-Berichten für die einzelnen Storage-Systeme):

Tabelle 2) Vergleich des NetApp Clusters mit anderen branchenführenden SPC-1 Ergebnissen.

 FAS6240 ClusterHDS VSPHuawei S8100IBM SVC + V7000IBM SVC + DS8000HP 3Par
SPC-1 IOPS250.039,67269.506,69300.062,04520.043,99380.489,30450.212,66
Reaktionszeit (ms)3,35 ms5,85 ms7,08 ms7,39 ms7,64 ms13,67 ms
Listenpreis
(US-Dollar)
1.672.602 $4.934.872 $2.311.568 $5.846.630 $13.672.255 $5.885.148 $
$/OP6,6918,317,7011,2435,9313,07
IOPS (~3 ms)*250.039,67
(3,35)
242.567,41
(3,23)
150.000,17
(3,60)
259.998,37
(2,71)
190.253,20
(2,96)
225.079,30
(3,29)
Anzahl der Controller68168 + 326 + 48
Anzahl der Festplatten4321.1521.1521.9202.0481.920
IOPS/Laufwerk579234260271186234
RAID-TypRAID-DPRAID 10RAID 10RAID 10RAID 10RAID 10

*Für diese Zahlen wurde für jedes einzelne Ergebnis jeweils der Datenpunkt ermittelt, der der Reaktionszeit von drei Millisekunden am nächsten war, und der IOPS-Wert an diesem Punkt angegeben. (Für jeden Datenpunkt wird die genaue Reaktionszeit angeführt.)

SPC-1 IOPS, IOPS/Laufwerk und Kosten/OP

In Tabelle 2 werden verschiedene Aspekte der SPC-1 Ergebnisse der sechs Systeme miteinander verglichen. Einige der Systeme erzielen bessere SPC-1 IOPS-Rohwerte (erste Reihe) als der NetApp FAS6240 Cluster. NetApp erzielt jedoch in der Kategorie „IOPS/Laufwerk" im Vergleich zu anderen Anbietern einen mehr als doppelt so hohen Wert und bietet außerdem das beste Kosten/OP-Ergebnis zum Listenpreis. Die Preise in der Tabelle wurden normalisiert und reflektieren den Listenpreis für alle Konfigurationen (einige Anbieter geben reduzierte Preise mit ihren SPC Ergebnissen an, wodurch ein Vergleich ohne Preisnormalisierung nicht möglich wäre).

IOPS bei niedriger Latenz

Ein Vergleich der maximalen Performance aller Systeme bei einer Latenz von drei Millisekunden (siehe fett gedruckte Zeile in der Tabelle) hat ergeben, dass nur IBM SVC mit V7000 das NetApp System übertrifft, und zwar lediglich um 4 %. Dieses System kostet in etwa das 3,5-Fache des NetApp Clusters zum Listenpreis und ist mit 8 SVC Virtualisierungs-Engines, 16 V7000 Systemen (jeweils aus 2 SVC Controllern und 2 RAID Controllern) und 1.920 Festplatten mit 146 GB und 15.000 U/min deutlich komplexer. (Diese Laufwerke stehen höchstwahrscheinlich nicht ganz oben auf Ihrer Einkaufsliste.) Im Vergleich dazu ist für den NetApp Cluster mit 6 Controllern und 432 Festplatten ein wesentlich geringerer Konfigurations- und Management-Aufwand erforderlich und das NetApp System verbraucht weniger Strom.

Systemkomplexität

Zusammenfassend bietet der NetApp FAS6240 Cluster hervorragende Ergebnisse mit weniger Hardware und Festplatten als die anderen gezeigten Systeme, und das Storage Array ist das Einzige, dass mit Dual Parity RAID statt mit Spiegelung getestet wurde. Folglich bietet das System ein einfacheres Management und eine insgesamt äußerst praxisnahe Konfiguration und ermöglicht außerdem niedrigere Management- und Energiekosten.

Wie sieht es mit Flash aus?

Es liegen zwar SPC-1 Ergebnisse mit hohen IOPS-Werten und geringen Reaktionszeiten für Systeme vor, die komplett auf DRAM und Flash beruhen, allerdings bieten diese Systeme noch nicht die Kapazitäten und Funktionen, die Unternehmen in der Regel zusammen mit den IOPS-Werten benötigen. Wenn Sie sehr hohe IOPS mit niedriger Kapazität benötigen, kann sich eine Evaluierung von reinen Flash- oder DRAM-basierten Lösungen durchaus lohnen, allerdings sollten Sie die entstehenden Kompromisse beachten.

NetApp bietet auch reine Flash-basierte Lösungen an, aber in naher Zukunft begünstigen die wirtschaftlichen Faktoren festplattenbasierte Storage-Systeme oder Hybridlösungen mit Festplatten und Flash, wenn Ihre Kapazitätsanforderungen bereits im zweistelligen Terabyte-Bereich liegen. Tabelle 3 veranschaulicht den Kostenunterschied anhand der geschätzten Kosten pro TB Rohkapazität.

Tabelle 3) Kapazitätskosten: DRAM und Flash Arrays im Vergleich mit dem NetApp Cluster.

 NetApp FAS6240 ClusterKaminario K2-DTMS RAMSAN-630
Rohkapazität 193 TB3,4 TB14 TB
Preis 1.672.602 $490.760 $419.292 $
Preis/TB8.666 $140.217 $29.949 $

Schlussfolgerung

NetApp demonstriert mit diesem SPC-1 Ergebnis die herausragende Performance von Data ONTAP 8 Cluster-Mode für SAN- und NAS-Workloads. Cluster-Mode bietet:

  • niedrige Latenz (Reaktionszeit) mit hoher Performance
  • dynamisch skalierbare Unified Cluster für FC, iSCSI, NFS und CIFS
  • exzellentes Preis-Leistungs-Verhältnis
  • unterbrechungsfreien Betrieb, beispielsweise bei Verschiebung von Daten zwischen Cluster Nodes (inkl. CIFS, was normalerweise so gut wie unmöglich ist)
  • Data ONTAP Funktionen, darunter Optimierung für Schreibzugriffe, Applikationsorientierung, Snapshot Kopien, Deduplizierung, Komprimierung, Replizierung, Thin Provisioning, Virtual Storage Tiering und mehr
  • Verwendung derselben Hardware für Cluster-Mode und 7-Mode, einschließlich der V-Series Plattformen, die Storage Arrays von anderen Anbietern virtualisieren
 Ihre Meinung zu Cluster-Mode?

Stellen Sie Fragen, tauschen Sie Ideen aus und diskutieren Sie online – in der NetApp Community!

Von Dimitris Krekoukias, Systems Engineer

Dimitris Krekoukias arbeitet seit mehr als 17 Jahren in der IT-Branche und verfügt über umfangreiche Erfahrung im Bereich Storage sowie mit umfassenden Backups und Recoverys, Virtualisierung, massiven Parallelsysteme und High Performance Computing. Er arbeitet seit drei Jahren für NetApp und ist ein Experte für Performance und Wettbewerb. Er verfasst unter www.recoverymonkey.org regelmäßig Blog-Beiträge zum Thema Performance und zu anderen Themen.

Tech OnTap
Melden Sie sich jetzt an.
Tech OnTap liefert jeden Monat Einblicke in die IT-Welt sowie exklusive Best Practices, Tipps und Tools, Interviews mit Entwicklern, Demos, Testberichte und vieles mehr.

Besuchen Sie Tech OnTap in der NetApp Community, um sich noch heute anzumelden.

Entdecken
Entdecken
Erfahren Sie mehr über Cluster-Mode

Möchten Sie mehr über Data ONTAP 8 Cluster-Mode Operationen erfahren? Lesen Sie diese Tech OnTap Artikel:



Mehr von diesem Autor

Möchten Sie mehr von diesem Autor lesen? Dimitris Krekoukias verfasst unter recoverymonkey.org regelmäßig Blog-Beiträge zu Themen wie Storage, Performance, Backup, Recovery und Archivierung. Seine sehr ausführlichen und technischen Beiträge sorgen oftmals für ebenso ausführliche und manchmal lebhafte Diskussionen.

Entdecken
 
TRUSTe
Kontakt   |   Bezugsquelle   |   Feedback   |   Karriere  |   Abonnements   |   Datenschutzrichtlinie   |   © 2012 NetApp