Tech OnTap di NetApp NetApp Logo
Tech OnTap di NetApp
     
Tiering automatizzato
e tier virtuale dello storage NetApp

L'obiettivo principale delle tecnologie AST (Automated Storage Tiering) consiste nell'offrire ai data center le performance superiori garantite dai supporti basati su Flash consentendo nel contempo di ridurre i costi e la complessità. I dispositivi basati su Flash, come le unità a stato solido (SSD) basate su controller, possono eseguire un numero di operazioni di lettura casuale al secondo superiore di 25-100 volte a quelle dei dischi rigidi (HDD) più veloci, ma a un costo per gigabyte superiore di 15-20 volte. Anche se i dischi rigidi continuano a crescere in termini di capacità, le loro performance in termini di IOPS per dollaro restano relativamente ferme. Le unità Flash offrono un numero di IOPS per dollaro nettamente superiore e una latenza minore.

La serie FAS6200.

Figura 1) Confronto fra l'efficienza nelle letture casuali dei diversi tipi di supporti a stato solido e a rotazione, su scala logaritmica. Nota: in termini di IOPS per dollaro, le differenze fra i diversi tipi di dischi rigidi sono relativamente ridotte.

Invece di collocare in maniera permanente un intero set di dati su supporti costosi, il tiering automatizzato dello storage cerca di identificare i dati attivi e memorizzarli su supporti storage a maggiori performance, trasferendo i dati meno attivi su supporti più lenti ed economici.

NetApp ha dedicato molto tempo e lavoro allo studio dei problemi che l'AST deve risolvere per garantire una soluzione ottimale.

In questo articolo vengono trattati i seguenti argomenti:

  • Criteri per la valutazione delle tecnologie AST
  • Confronto fra gli approcci AST basati sulla migrazione e quelli basati sul caching
  • Approccio tier virtuale dello storage NetApp® per l'AST basato sul caching

Valutazione della tecnologia AST

Dal punto di vista dell'I/O, il principale obiettivo dell'AST consiste nello spostare il maggior quantitativo possibile di I/O casuale su supporti ad alte performance (Flash), in modo da ridurre al minimo il carico di I/O dei dischi rigidi e ridurre la latenza media. La distinzione fra I/O casuale e I/O sequenziale è molto importante: per quanto riguarda le letture e le scritture sequenziali, le unità Flash offrono vantaggi relativamente contenuti in termini di rapporto prezzo/performance rispetto ai dischi rigidi, che sono ideali per gli I/O sequenziali.

La serie FAS6200.

Figura 2) Confronto fra l'efficienza del throughput sequenziale di diversi tipi di supporti a stato solido e a rotazione.

Esistono diversi fattori che influenzano la possibilità di raggiungere il suddetto obiettivo con una soluzione AST:

  • Qual è la granularità del posizionamento dei dati? Minori sono le dimensioni del blocco di dati su cui si opera maggiore è l'efficienza ottenibile dalle risorse di sistema e dei dischi rigidi utilizzati per il collocamento. Minori sono inoltre le probabilità che i dati non attivi vengano "aggregati" con i dati attivi, consumando solamente risorse costose senza offrire alcun vantaggio pratico.
  • In che modo vengono identificati i dati attivi? Qual è l'entità dell'accelerazione ottenuta? Il miglioramento della latenza media sarà direttamente proporzionale alla velocità di memorizzazione dei dati attivi nelle unità Flash e inversamente proporzionale alla probabilità che i picchi di I/O di durata relativamente breve vengano persi e alla necessità di I/O dei dischi rigidi.

Dal punto di vista operativo, occorre prendere in considerazione una serie di fattori aggiuntivi:

Qual è il livello di difficoltà per l'implementazione e la gestione della soluzione? Le soluzioni AST che richiedono un'importante riconfigurazione o una notevole quantità di operazioni di gestione e monitoraggio per l'implementazione potrebbero non essere idonee agli obiettivi prefissati.

In che modo è possibile integrare la soluzione con le altre tecnologie storage da voi utilizzate (backup, deduplica, thin provisioning e così via)? L'ultima cosa che volete è implementare una soluzione per poi scoprire che non consente di eseguire backup o che i backup richiedono spostamenti di dati su larga scala.

Confronto fra migrazione e caching per l'AST

Esistono due approcci sostanzialmente differenti all'AST: migrazione e caching.

L'AST basato sulla migrazione consente di automatizzare il processo di migrazione dei dati. I blocchi di dati identificati come "attivi" vengono spostati su supporti più veloci, per poi essere riportati su quelli più lenti quando non sono più attivi. Per spostare i dati nelle unità Flash (e viceversa) è necessario accedere al disco rigido.

L'AST basato sul caching utilizza metodi diffusi per "promuovere" i dati attivi sui supporti ad alte performance. Poiché sul disco rigido rimane memorizzata una copia dei dati, quando essi non sono più attivi possono essere liberati dalla cache senza dover eseguire ulteriori I/O dal disco rigido.

La serie FAS6200.

Figura 3) Confronto fra tiering automatizzato dello storage basato su caching o sulla migrazione.

Tier virtuale dello storage NetApp

NetApp ha analizzato questi due approcci all'AST alla luce dei criteri di valutazione analizzati in precedenza e ha stabilito che l'approccio basato sul caching è più adatto a gestire questi criteri in maniera più efficiente.

Inoltre, NetApp è riuscita a dedicarsi all'ottimizzazione delle performance in lettura grazie alla possibilità offerta da NetApp WAFL® (Write Anywhere File Layout) di trasformare le attività di scrittura in scritture sequenziali che, in base a quanto illustrato dalla figura 2, è possibile gestire in maniera efficiente con i dischi rigidi. Questo argomento è stato dettagliatamente spiegato in un recente post di blog di Mike Riley e del redattore di Tech OnTap® John Fullbright (questo è anche il motivo per cui RAID-DP®, il RAID a doppia parità di NetApp, consente di ottenere buone performance in scrittura, a differenza di quanto avviene con le altre implementazioni di RAID 6).

La serie FAS6200.

Figura 4) Il tier virtuale dello storage NetApp è un approccio al tiering automatizzato dello storage basato su caching.

Il tier virtuale dello storage NetApp consente di spostare i dati attivi nella cache riducendo al minimo l'overhead di I/O dei dischi rigidi. Ogni volta che viene ricevuta una richiesta di lettura per un blocco su un volume o su una LUN, il blocco verrà automaticamente sottoposto a promozione. Nota: la promozione non equivale a una migrazione di dati, poiché il blocco di dati rimane sul disco rigido anche quando viene copiato nel tier virtuale dello storage. La promozione ha luogo direttamente dalla cache del buffer di sistema, senza necessità di ulteriore I/O dal disco rigido.

La possibilità di promuovere immediatamente i blocchi di dati subito dopo la prima lettura da disco consente di evitare l'utilizzo di ulteriore I/O da disco. In confronto, le implementazioni di AST basate sulla migrazione non promuovono i dati attivi fino a quando non vengono letti più volte da disco o fino alla successiva migrazione pianificata, richiedendo ulteriore I/O da disco per eseguire il processo di migrazione.

Gli algoritmi NetApp sono in grado di distinguere i dati ad alto valore da quelli a basso valore, in modo da poterli conservare nel tier virtuale dello storage. Ad esempio, i metadati vengono promossi sempre alla prima lettura. Al contrario, le letture sequenziali non vengono inserite nella cache del tier virtuale dello storage, a meno che questa funzionalità non venga attivata. Ciò dipende da due motivi: la tendenza di queste letture a occupare molto dello spazio riservato ai dati più importanti e la possibilità di gestirle in maniera più efficiente con i dischi rigidi. È possibile modificare questo comportamento per soddisfare i requisiti delle applicazioni caratterizzate da un accesso univoco ai dati o da diversi requisiti di livello di servizio.

Vantaggi del tier virtuale dello storage

Promozione in tempo reale dei dati attivi con elevata granularità. Di solito, un blocco di dati entra nel tier virtuale dello storage quando viene letto per la prima volta dal disco. È possibile ottenere vantaggi di performance in tempo reale poiché le successive letture vengono eseguite dal tier virtuale dello storage. Anche se vengono identificati schemi di comportamento per la lettura e i blocchi di dati più idonei vengono letti in anticipo, il tier virtuale dello storage non esegue mai movimenti di dati su larga scala da un tier di storage all'altro. In questo modo, è possibile ridurre al minimo l'utilizzo dell'I/O dei dischi rigidi e delle altre risorse di sistema. L'efficienza di questo approccio, insieme alla possibilità di operare con la granularità di un singolo blocco da 4 KB, consente di eseguire la promozione in tempo reale dei dati attivi.

Utilizzando un AST basato sulla migrazione, i dati attivi vengono trasferiti da un tier di storage all'altro, come attività in background o attività pianificata durante ore di utilizzo più basso, in modo da ridurre al minimo il carico aggiuntivo del sistema storage. Poiché queste soluzioni utilizzano spesso un livello di granularità almeno 128 volte superiore a quello del tier virtuale dello storage (da 0,5 MB a 1 GB o persino di un intero volume o una LUN), lo spostamento dei dati può richiedere molto tempo. Questi tipi di approcci possono tralasciare picchi di attività importanti e di durata inferiore al tempo necessario per identificare i dati attivi e promuoverli.

La granularità a 4 KB del tier virtuale dello storage garantisce un utilizzo molto efficiente dei supporti basati su Flash. È molto probabile che le soluzioni dotate di minore granularità includano numerosi dati "non attivi" in ciascun blocco di dati attivo, richiedendo un quantitativo maggiore di costosi supporti Flash per ottenere i medesimi risultati.

Semplice da implementare e da gestire. Il tier virtuale dello storage è compatibile con i volumi di dati e le LUN esistenti. Non richiede complesse modifiche al vostro ambiente storage, né interruzioni operative. Non occorre definire policy, soglie o finestre temporali specifiche per lo spostamento dei dati. È sufficiente installare la tecnologia Flash nei vostri sistemi storage. Fatto ciò, il tier virtuale dello storage diventa attivo su tutti i volumi gestiti dallo storage controller. Quindi, se volete, potete escludere dal tier virtuale dello storage i dati utente dei volumi a priorità più bassa.

Le altre soluzioni di AST richiedono policy incrementali, classificazione dei dati e modifiche strutturali all'infrastruttura storage esistente, come la creazione di pool storage dedicati e la migrazione dei dati.

Completamente integrato. Il tier virtuale dello storage è completamente integrato nell'architettura storage unificata di NetApp e consente di utilizzare qualunque protocollo storage NAS o SAN senza apportare alcuna modifica.

Inoltre, le soluzioni AST basate sulla migrazione non sono in grado di interoperare con le funzionalità di efficienza dello storage come la deduplica. Il tier virtuale dello storage agisce insieme a tutte le funzionalità di efficienza dello storage NetApp, come il thin provisioning, FlexClone®, la deduplica e la compressione, ottenendo un'efficace integrazione che offre notevoli vantaggi e consente di migliorare il funzionamento del tier virtuale dello storage.

Ad esempio, se si deduplica un volume, i vantaggi di tale operazione saranno validi anche nel tier virtuale dello storage. Un singolo blocco del tier virtuale dello storage può essere utilizzato come destinazione di numerosi puntatori dei metadati, aumentando le probabilità di lettura ripetuta e il valore della promozione. Grazie a questo tipo di amplificazione della cache, un singolo blocco del tier virtuale dello storage può agire come molteplici blocchi logici. Ciò può offrire notevoli vantaggi in termini di performance per gli ambienti di virtualizzazione desktop e server, come la riduzione della durata degli avvii di massa, riducendo anche il quantitativo di supporti Flash necessari.

Conclusioni

Il nostro approccio all'AST basato sul caching offre al tier virtuale dello storage NetApp notevoli vantaggi rispetto all'AST basato sulla migrazione. Con il tier virtuale dello storage è possibile promuovere i dati in tempo reale, consentendo anche ai brevi picchi di attività di sfruttare i vantaggi garantiti dall'accelerazione. La granularità di 4 KB offerta da NetApp consente di escludere, in maniera molto efficiente, i dati meno attivi dalle unità Flash, richiedendo un numero inferiore di unità di questo tipo per ottenere buoni risultati. In confronto, l'AST basato sulla migrazione è meno granulare, richiede una maggiore latenza prima di eseguire la promozione dei dati, sfrutta una maggiore attività di I/O del disco rigido e utilizza in maniera meno efficiente le costose unità disco basate su Flash.

Il tier virtuale dello storage utilizza i dischi rigidi come tier per la capacità e Flash come tier per le performance. Probabilmente state utilizzando numerosi tipi di unità disco, come FC, SATA e SAS. Tutti questi tipi di unità possono agire da tier per le capacità, mentre il tier virtuale dello storage fornisce le performance. Siamo convinti che la combinazione di un tier ad alte performance (basato sul tier virtuale dello storage) e di un singolo tier basato sulle unità disco (basato su unità SATA) sia la soluzione più logica per la maggior parte delle applicazioni presenti e future.

 Desiderate condividere le vostre opinioni sul tiering automatizzato dello storage?

Le Community NetApp online consentono di porre domande, scambiare idee e condividere pensieri.

Paul Feresten
Senior Product Marketing Manager
NetApp


Paul ha iniziato a lavorare per NetApp nel 2005, occupandosi di importanti prodotti software NetApp come Data ONTAP®, MultiStore®, FlexClone e il thin provisioning. Ha oltre 30 anni di esperienza nella gestione di prodotti, nelle vendite, nel marketing e nella gestione esecutiva. Prima di entrare in NetApp, Paul ha lavorato per Data General, Digital Equipment Corporation, MSI Consulting e SEPATON.



Rajesh Sundaram
Technical Director
NetApp


Sin dal suo arrivo in NetApp nel 1997, Rajesh ha lavorato al file system WAFL, al sottosistema RAID di Data ONTAP e all'integrazione della tecnologia Flash nello storage NetApp. Rajesh vanta un MS in informatica ottenuto alla University of Arizona.


Tech OnTap
Abbonatevi subito
Tech OnTap offre approfondimenti mensili sull'IT, oltre all'accesso esclusivo a best practice derivate da esperienze reali, suggerimenti e strumenti, interviste "dietro le quinte" con gli esperti, dimostrazioni, recensioni degli utenti e molto altro ancora.

Per iscrivervi subito, visitate il sito Tech OnTap nella Community NetApp.

Esplora
Esplora
Ulteriori informazioni su VST

Volete saperne di più su VST? Un white paper di recente pubblicazione offre tutte le informazioni necessarie, inclusa la misurazione delle performance in diversi ambienti operativi.


Desktop virtuali e VST

Il tier virtuale dello storage NetApp può avere un impatto enorme sugli ambienti di desktop virtuale. Un recente post di blog di Vaughn Stewart descrive l'enorme carico che può essere generato da questi ambienti e spiega in che modo VST può ridurre il numero di spindle e incrementare il numero di desktop che un ambiente storage può supportare aumentando nel contempo il throughput dati complessivo.


Caching intelligente

Flash Cache consente di ridurre fino al 75% i costi relativi allo storage diminuendo il numero di spindle necessari per ciascun livello di performance e sostituendo le unità disco ad alte performance con prodotti più economici. Ulteriori informazioni su questa tecnologia straordinariamente innovativa.

Esplora
 
TRUSTe
Contatti   |   Come acquistare   |   Commenti   |   Opportunità di lavoro  |   Sottoscrizioni   |   Informativa sulla privacy   |   © 2011 NetApp