Tech OnTap di NetApp Logo NetApp
Tech OnTap di NetApp
     
Il cluster FAS6200 offre incredibili block I/O performance a bassa latenza
Dimitris Krekoukias
Systems Engineer

NetApp® Data ONTAP® 8 Cluster-Mode è l'unica piattaforma storage del settore unificata, a scalabilità orizzontale, in grado di supportare protocolli NAS e SAN con lo stesso cluster. Un altro articolo di questo numero di Tech OnTap® include il case study dell'implementazione Cluster-Mode di un provider cloud in rapida crescita. Nei precedenti articoli di Tech OnTap sono state descritte le caratteristiche e le funzionalità Cluster-Mode e sono state dimostrate le performance e la scalabilità del prodotto in base al benchmark NFS SPECsfs. Un cluster di 24 sistemi FAS6240 è riuscito a ottenere oltre 1,5 milioni di op/sec SPECsfs2008_nfs.v3 a bassa latenza.

Le incredibili performance di file-serving Cluster-Mode hanno aumentato la curiosità dei clienti relativamente alle performance con carichi di lavoro a blocchi. NetApp ha recentemente richiesto un benchmark SPC-1 per un cluster FAS6240 a sei nodi, in cui è stata dimostrata la possibilità di raggiungere oltre 250.000 SPC-1 IOPS™ (il cluster era costruito con alcuni componenti utilizzati nei nostri test SPECsfs). La combinazione degli IOPS elevati e della bassa latenza ha prodotto uno dei migliori risultati SPC-1 mai ottenuti per un sistema storage enterprise basato su disco.

Panoramica dell'architettura di PeakColo.

Figura 1) IOPS SPC-1 per un cluster NetApp FAS6240 a sei nodi.

In questo articolo analizzeremo il benchmark SPC-1, parlando anche dell'importanza della latenza. Quindi, passeremo ai più recenti risultati di NetApp e della concorrenza, mettendo a confronto lo storage su disco con quello basato su Flash.

Il benchmark SPC-1

Storage Performance Council (SPC) è un consorzio di vendor storage, integratori e istituti accademici creato per definire, standardizzare e promuovere i benchmark storage. SPC-1, sviluppato da Storage Performance Council, è un benchmark basato su blocchi standard di settore, convalidato e rigoroso, in grado di mettere alla prova i sottosistemi dischi con un misto di I/O che comprende scritture, sovrascritture, scritture dopo letture, letture dopo scritture, hotspot, operazioni casuali e sequenziali. In generale, circa il 60% dei carichi di lavoro si basa sulle scritture, rendendo il test molto impegnativo per i sistemi storage. Le dimensioni di I/O variano da piccole a grandi.

SPC-1 è forse il benchmark più efficace per definire le metodologie con cui i database mettono alla prova i sistemi storage. Quando SPC ha sviluppato il benchmark, ha studiato il modo in cui numerose applicazioni eseguivano l'accesso allo storage, per poi modellare il carico di lavoro in base alle misurazioni rilevate. Il mix di operazioni eseguite rappresenta un'ampia classe di applicazioni, circa metà di quelle commerciali.

Gli schemi di accesso di SPC-1 producono hotspot che rappresentano una parte significativa del carico di lavoro complessivo. Questo tipo di hotspot può essere parzialmente contenuto in cache (a patto che quest'ultima sia di dimensioni sufficienti) o collocato su SSD, se lo storage oggetto del test dispone di un sistema di tiering automatizzato dello storage (AST) sufficientemente granulare e smart.

Anche se nessun benchmark è perfetto, SPC-1 è forse il benchmark standardizzato più efficace per misurare le block I/O performance casuali e per effettuare confronti fra diversi vendor. Se un sistema storage ottiene un buon risultato con SPC-1, si comporterà in maniera ottimale anche con carichi di lavoro complessi, dinamici e sensibili in termini di latenza, come ad esempio le applicazioni generiche di database e soprattutto OLTP, e-mail e virtualizzazione. Gli utenti più curiosi possono leggere le specifiche complete.

SPC-1 non è un benchmark basato sul throughput: per questo tipo di analisi legate ai GB/s è consigliabile consultare altri documenti.

Interpretazione dei risultati del benchmark

Con i benchmark, il trucco consiste nell'interpretare i risultati nel modo giusto. Un singolo valore di IOPS potrebbe non riuscire a offrire un quadro complessivo. Esistono numerosi aspetti da analizzare nell'esame di un report SPC-1.

Sostenibilità. Tutti i benchmark SPC-1 comprendono un test di sostenibilità da eseguire per almeno otto ore. È importante cercare di ottenere IOPS costantemente alti e sostenuti. Le performance non devono ridursi durante l'intervallo e la lunghezza del test è direttamente proporzionale all'efficacia.

IOPS/unità. Si tratta di una misurazione dell'efficienza con cui il sistema storage riesce a gestire l'hardware sottostante: 500 IOPS/unità rappresenta un'efficienza due volte più grande rispetto a 250 IOPS/unità. Utilizzando le unità in maniera più efficiente, è possibile acquistarne un numero inferiore per ottenere un dato livello di performance, riducendo i costi e il footprint fisico.

Tempo di risposta (latenza). Il tempo di risposta di SPC-1 è una misura del tempo impiegato per il completamento di una transazione I/O media dal punto di vista dell'applicazione. Un tempo di risposta più breve, ovvero una risposta più rapida, indica un risultato migliore. È possibile (anche se non ottimale) ottenere un valore di IOPS e un tempo di risposta entrambi molto elevati. Per quanto riguarda le transazioni dei database, un tempo di risposta pari a 10 ms è considerato il limite per ottenere buone performance sulle operazioni di lettura (al di sopra dei 20 ms, vendor come Microsoft considerano i database danneggiati), mentre le scritture devono essere riconosciute in maniera ancora più rapida. Infine, i file di registro di ripristino devono essere riconosciuti in maniera quasi istantanea.

Questi sono alcuni dei motivi per cui NetApp lavora alacremente per ottenere una bassa latenza. Per ulteriori informazioni su IOPS e latenza, è possibile consultare il mio recente post di blog.

Costo per OP. Si tratta della misurazione del quantitativo di denaro da spendere per ciascuna operazione. In sostanza, si tratta del prezzo complessivo del sistema diviso per il risultato di IOPS fornito da SPC-1. È necessario prestare una certa attenzione, poiché alcuni vendor utilizzano prezzi scontati, mentre altri applicano i prezzi di listino, alterando così i risultati.

Protezione RAID. Quale tipo di protezione RAID è stata usata per il test? Gran parte dei risultati SPC-1 utilizzano il mirroring (RAID 10 o RAID 1+O) per eliminare l'overhead della parità. Nel mondo reale, ciò comporterebbe una spesa per i dischi molto superiore rispetto al prezzo d'acquisto di una capacità usabile analoga ma con RAID single-parity o dual-parity.

Hardware complessivo necessario. Qual è il livello di complessità della configurazione hardware? Quali tipi di dischi sono stati utilizzati? Si tratta di un sistema che è possibile implementare senza problemi nel mondo reale o di uno progettato per ottenere un risultato positivo nei benchmark?

Il risultato SPC-1 di NetApp

Il risultato SPC-1 di NetApp è descritto nella Figura 1 qui sopra. Abbiamo utilizzato un cluster FAS6240 a 6 nodi (3 coppie HA), ciascuno dei quali dotato di un modulo Flash Cache da 512 GB (standard con FAS6240) e di un totale di 432 unità disco (unità SAS da 15.000 giri/min. da 450 GB, 72 per controller).

Flash Cache è parte del NetApp Virtual Storage Tier (VST): i dati in lettura più utilizzati vengono promossi automaticamente su Flash. Un singolo controller FAS6240 è in grado di supportare fino a 3 TB di Flash Cache, per cui una scheda da 512 GB in ciascun nodo del cluster rappresenta un fattore di limitazione rispetto alle possibilità di implementazione in una tipica configurazione di data center.

In maniera analoga, anche l'utilizzo di sole 72 unità disco per controller rappresenta un fattore di limitazione, poiché un singolo controller FAS6240 può supportare fino a 1.440 unità disco. Come dischi abbiamo utilizzato unità SAS da 15.000 giri/min. da 450 GB. Nota: in tutti i test abbiamo abilitato la tecnologia RAID-DP®, l'implementazione NetApp del RAID 6 double-parity per essere coerenti con l'esperienza pratica dei nostri clienti (RAID-DP è l'impostazione predefinita per NetApp). La tabella 1 riepiloga i risultati del benchmark per le metriche indicate qui sopra.

Tabella 1) Performance di NetApp per le principali metriche SPC-1.

Cluster NetApp FAS6240 a 6 nodi
SPC-1 IOPS250.039,67
SPC-1 IOPS/disco579
Tempo di risposta (latenza)3,35 ms
Costo per OP$ 6,69 (prezzo di listino)
Protezione RAIDRAID-DP (dual parity RAID 6)
Dischi totali442
Controller6

Inoltre, durante i test di sostenibilità o ripetibilità non abbiamo riscontrato alcun degrado delle performance con il passare del tempo. Come verrà illustrato nella sezione successiva, si tratta di risultati eccellenti, soprattutto in termini di IOPS con bassi tempi di risposta (latenza).

Confronto con altri risultati leader SPC-1

Abbiamo analizzato i principali risultati del test SPC-1 basato su disco per una soglia del tempo di risposta pari a circa 3 ms. Secondo l'analisi, grazie alla bassa latenza degli IOPS forniti, i risultati SPC-1 di NetApp si sono classificati fra i migliori in assoluto per quanto riguarda i sistemi enterprise basati su disco. NetApp è riuscita a ottenere performance simili a quelle di Flash, ma con una configurazione basata soprattutto su HDD.

L'obiettivo di un tempo di risposta pari a 3 ms è coerente con le esigenze delle applicazioni di database a bassa latenza, come ad esempio quelle utilizzate dalle aziende del settore finanziario. Per la maggioranza dei carichi di lavoro dei database, latenze di I/O molto basse consentono di migliorare il funzionamento di tali applicazioni.

È possibile consultare un'analisi molto più completa (con l'aggiunta di alcuni commenti) leggendo il mio recente post di blog relativo a questi risultati.

I sistemi storage confrontati comprendono i seguenti (i collegamenti ipertestuali qui sotto consentono di visualizzare il report del benchmark SPC-1 completo per ciascun sistema storage):

Tabella 2) Confronto del cluster NetApp con altri risultati leader SPC-1.

 Cluster FAS6240HDS VSPHuawei S8100IBM SVC+V7000IBM SVC+DS8000HP 3Par
SPC-1 IOPS250.039,67269.506,69300.062,04520.043,99380.489,30450.212,66
Tempo di risposta (ms)3,35 ms5,85 ms7,08 ms7,39 ms7,64 ms13,67 ms
Prezzo di listino ($)$ 1.672.602$ 4.934.872$ 2.311.568$ 5.846.630$ 13.672.255$ 5.885.148
$/OP6,6918,317,7011,2435,9313,07
IOPS (~3 ms)*250.039,67
(3,35)
242.567,41
(3,23)
150.000,17
(3,60)
259.998,37
(2,71)
190.253,20
(2,96)
225.079,30
(3,29)
N. di controller68168+326+48
N. di dischi4321.1521.1521.9202.0481.920
IOPS/disco579234260271186234
RAIDRAID-DPRAID 10RAID 10RAID 10RAID 10RAID 10

*Queste cifre sono state ottenute localizzando il punto dati di ciascun risultato più vicino a un tempo di risposta di 3 ms e indicando gli IOPS corrispondenti. Per ciascun punto dati viene indicato il tempo di risposta preciso.

IOPS SPC-1, IOPS/disco e Costo/Op

La tabella 2 confronta i diversi aspetti dei risultati SPC-1 dei sei sistemi. In verità, alcuni sistemi hanno ottenuto valori di IOPS SPC-1 grezzi superiori (prima riga) al cluster NetApp FAS6240. Tuttavia, NetApp offre più del doppio degli IOPS/disco rispetto agli altri vendor e ha ottenuto anche il miglior risultato in dollari per OP per quanto riguarda il prezzo di listino. Ho bilanciato i prezzi della tabella in modo da rispecchiare il prezzo di listino di tutte le configurazioni (alcuni vendor hanno segnalato prezzi scontati, rendendo quasi impossibile eseguire confronti senza prima aver bilanciato i prezzi).

IOPS a bassa latenza

Nel confrontare le performance massime di tutti i sistemi a una latenza di 3 ms (indicata nella tabella con un carattere in grassetto), solo il sistema IBM SVC con V7000 ha ottenuto performance superiori a NetApp, ma del solo 4%. Si tratta di un sistema con un prezzo di listino pari a 3,5 volte quello del cluster NetApp e molto più complesso a causa degli 8 motori di virtualizzazione SVC, dei 16 sistemi V7000 (ciascuno di essi costituito da 2 controller SVC e 2 controller RAID) e da 1.920 unità disco da 15K giri/min di 146 GB. Non è certo un tipo di disco molto diffuso di questi tempi. Tutto ciò richiede un notevole lavoro in termini di configurazione, gestione e consumo energetico rispetto al cluster NetApp, che è costituito da 6 controller e 432 unità disco.

Complessità del sistema

Nel complesso, il cluster NetApp FAS6240 offre risultati eccellenti con un minore quantitativo di hardware e di dischi rispetto agli altri sistemi storage indicati. Inoltre, si tratta dell'unico array storage sottoposto a test con un RAID dual-parity e non con il mirroring. Tutto ciò si traduce in una gestione più semplice, nella riduzione dei costi energetici e di gestione e in una configurazione complessiva molto più realistica.

Cosa dire di Flash?

Anche se i risultati SPC-1 valgono per i sistemi basati interamente su DRAM e Flash, in grado di ottenere elevati IOPS con tempi di risposta molto bassi, si tratta di sistemi che al momento non offrono la capacità o le funzionalità di cui le grandi imprese hanno bisogno oltre agli IOPS citati. Se occorre un numero di IOPS molto elevato e una capacità molto bassa, le soluzioni interamente basate su Flash o DRAM sono da prendere in considerazione, così come i relativi compromessi.

Anche se NetApp offre anche opzioni interamente basate su Flash, nel prossimo futuro il fattore convenienza sarà saldamente a favore dei sistemi storage basati su disco, o di quelli ibridi con disco e flash, per requisiti di capacità superiori ad alcune decine di terabyte. La tabella 3 dimostra il differenziale economico attraverso un semplice calcolo che indica il costo approssimativo per terabyte della capacità grezza.

Tabella 3) Costo della capacità: confronto fra array DRAM e Flash e il cluster NetApp.

 Cluster NetApp FAS6240Kaminario K2-DTMS RAMSAN-630
Capacità grezza 193 TB3,4 TB14 TB
Prezzo $ 1.672.602$ 490.760$ 419.292
Prezzo/TB$ 8.666$ 140.217$ 29.949

Conclusioni

Con questo risultato SPC-1, NetApp ha dimostrato che Data ONTAP 8 Cluster-Mode offre performance eccellenti per carichi di lavoro SAN e NAS. Cluster-Mode offre:

  • Bassa latenza (tempo di risposta) con performance elevate
  • Cluster unificati e scalabili in maniera dinamica per FC, iSCSI, NFS e CIFS
  • Eccellente rapporto prezzo/performance
  • Operazioni senza interruzioni, ad esempio per lo spostamento dei dati sui nodi del cluster (anche CIFS, che normalmente è ingestibile per questo tipo di operazioni)
  • L'insieme di funzionalità di Data ONTAP, comprensivo di ottimizzazione delle scritture, consapevolezza delle applicazioni, copie Snapshot™, deduplica, compressione, replica, thin provisioning, tiering storage virtuale e molto altro ancora
  • Possibilità di utilizzare lo stesso hardware per Cluster-Mode e 7-Mode, comprese le piattaforme V-Series, in grado di virtualizzare gli array storage di altri vendor
 Desideri condividere le tue opinioni sul Cluster-Mode?

La community NetApp online ti consente di porre domande, scambiare idee e condividere commenti.

Di Dimitris Krekoukias, Systems Engineer

Dimitris vanta oltre 17 anni di esperienza nel settore IT e un'elevata competenza nell'ambito di storage, backup e ripristino a larga scala, virtualizzazione, sistemi massivamente paralleli e calcolo ad alte performance. Sin dal suo ingresso in NetApp, che risale a tre anni fa, ha lavorato come esperto nel campo della concorrenza e delle performance. Dimitris gestisce un blog sulle performance e su altri argomenti, che è possibile consultare all'indirizzo www.recoverymonkey.org.

Tech OnTap
Iscriviti subito
Tech OnTap presenta ogni mese approfondimenti sull'IT, best practice basate su esperienze reali, suggerimenti e tool, interviste "dietro le quinte" con gli esperti, demo, recensioni degli utenti e molto altro ancora.

Per iscriverti subito, visita la sezione Tech OnTap della community NetApp.

Esplora
Esplora
Ulteriori informazioni su Cluster-Mode

Vuoi saperne di più sul funzionamento di Data ONTAP 8 Cluster-Mode? Consulta questi articoli di Tech OnTap:



Altro di questo autore

Desideri leggere altro materiale di questo autore? Dimitris tiene regolarmente un blog su storage, performance, backup, ripristino e archiviazione, che è possibile consultare all'indirizzo www.recoverymonkey.org. I suoi dettagliati articoli tecnici producono discussioni altrettanto ricche di particolari e spesso piuttosto vivaci.

Esplora
 
TRUSTe
Contatti   |   Come acquistare   |   Feedback   |   Opportunità di lavoro  |   Iscrizioni   |   Informativa sulla privacy   |   © 2012 NetApp