Tiering automatizzato e tier virtuale dello storage NetApp L'obiettivo principale delle tecnologie AST (Automated Storage Tiering) consiste nell'offrire ai data center le performance superiori garantite dai supporti basati su Flash consentendo nel contempo di ridurre i costi e la complessità. I dispositivi basati su Flash, come le unità a stato solido (SSD) basate su controller, possono eseguire un numero di operazioni di lettura casuale al secondo superiore di 25-100 volte a quelle dei dischi rigidi (HDD) più veloci, ma a un costo per gigabyte superiore di 15-20 volte. Anche se i dischi rigidi continuano a crescere in termini di capacità, le loro performance in termini di IOPS per dollaro restano relativamente ferme. Le unità Flash offrono un numero di IOPS per dollaro nettamente superiore e una latenza minore. Figura 1) Confronto fra l'efficienza nelle letture casuali dei diversi tipi di supporti a stato solido e a rotazione, su scala logaritmica. Nota: in termini di IOPS per dollaro, le differenze fra i diversi tipi di dischi rigidi sono relativamente ridotte. Invece di collocare in maniera permanente un intero set di dati su supporti costosi, il tiering automatizzato dello storage cerca di identificare i dati attivi e memorizzarli su supporti storage a maggiori performance, trasferendo i dati meno attivi su supporti più lenti ed economici. NetApp ha dedicato molto tempo e lavoro allo studio dei problemi che l'AST deve risolvere per garantire una soluzione ottimale. In questo articolo vengono trattati i seguenti argomenti:
Valutazione della tecnologia AST Dal punto di vista dell'I/O, il principale obiettivo dell'AST consiste nello spostare il maggior quantitativo possibile di I/O casuale su supporti ad alte performance (Flash), in modo da ridurre al minimo il carico di I/O dei dischi rigidi e ridurre la latenza media. La distinzione fra I/O casuale e I/O sequenziale è molto importante: per quanto riguarda le letture e le scritture sequenziali, le unità Flash offrono vantaggi relativamente contenuti in termini di rapporto prezzo/performance rispetto ai dischi rigidi, che sono ideali per gli I/O sequenziali. Figura 2) Confronto fra l'efficienza del throughput sequenziale di diversi tipi di supporti a stato solido e a rotazione. Esistono diversi fattori che influenzano la possibilità di raggiungere il suddetto obiettivo con una soluzione AST:
Dal punto di vista operativo, occorre prendere in considerazione una serie di fattori aggiuntivi: Qual è il livello di difficoltà per l'implementazione e la gestione della soluzione? Le soluzioni AST che richiedono un'importante riconfigurazione o una notevole quantità di operazioni di gestione e monitoraggio per l'implementazione potrebbero non essere idonee agli obiettivi prefissati. In che modo è possibile integrare la soluzione con le altre tecnologie storage da voi utilizzate (backup, deduplica, thin provisioning e così via)? L'ultima cosa che volete è implementare una soluzione per poi scoprire che non consente di eseguire backup o che i backup richiedono spostamenti di dati su larga scala. Confronto fra migrazione e caching per l'AST Esistono due approcci sostanzialmente differenti all'AST: migrazione e caching. L'AST basato sulla migrazione consente di automatizzare il processo di migrazione dei dati. I blocchi di dati identificati come "attivi" vengono spostati su supporti più veloci, per poi essere riportati su quelli più lenti quando non sono più attivi. Per spostare i dati nelle unità Flash (e viceversa) è necessario accedere al disco rigido. L'AST basato sul caching utilizza metodi diffusi per "promuovere" i dati attivi sui supporti ad alte performance. Poiché sul disco rigido rimane memorizzata una copia dei dati, quando essi non sono più attivi possono essere liberati dalla cache senza dover eseguire ulteriori I/O dal disco rigido. Figura 3) Confronto fra tiering automatizzato dello storage basato su caching o sulla migrazione. Tier virtuale dello storage NetApp NetApp ha analizzato questi due approcci all'AST alla luce dei criteri di valutazione analizzati in precedenza e ha stabilito che l'approccio basato sul caching è più adatto a gestire questi criteri in maniera più efficiente. Inoltre, NetApp è riuscita a dedicarsi all'ottimizzazione delle performance in lettura grazie alla possibilità offerta da NetApp WAFL® (Write Anywhere File Layout) di trasformare le attività di scrittura in scritture sequenziali che, in base a quanto illustrato dalla figura 2, è possibile gestire in maniera efficiente con i dischi rigidi. Questo argomento è stato dettagliatamente spiegato in un recente post di blog di Mike Riley e del redattore di Tech OnTap® John Fullbright (questo è anche il motivo per cui RAID-DP®, il RAID a doppia parità di NetApp, consente di ottenere buone performance in scrittura, a differenza di quanto avviene con le altre implementazioni di RAID 6). Figura 4) Il tier virtuale dello storage NetApp è un approccio al tiering automatizzato dello storage basato su caching. Il tier virtuale dello storage NetApp consente di spostare i dati attivi nella cache riducendo al minimo l'overhead di I/O dei dischi rigidi. Ogni volta che viene ricevuta una richiesta di lettura per un blocco su un volume o su una LUN, il blocco verrà automaticamente sottoposto a promozione. Nota: la promozione non equivale a una migrazione di dati, poiché il blocco di dati rimane sul disco rigido anche quando viene copiato nel tier virtuale dello storage. La promozione ha luogo direttamente dalla cache del buffer di sistema, senza necessità di ulteriore I/O dal disco rigido. La possibilità di promuovere immediatamente i blocchi di dati subito dopo la prima lettura da disco consente di evitare l'utilizzo di ulteriore I/O da disco. In confronto, le implementazioni di AST basate sulla migrazione non promuovono i dati attivi fino a quando non vengono letti più volte da disco o fino alla successiva migrazione pianificata, richiedendo ulteriore I/O da disco per eseguire il processo di migrazione. Gli algoritmi NetApp sono in grado di distinguere i dati ad alto valore da quelli a basso valore, in modo da poterli conservare nel tier virtuale dello storage. Ad esempio, i metadati vengono promossi sempre alla prima lettura. Al contrario, le letture sequenziali non vengono inserite nella cache del tier virtuale dello storage, a meno che questa funzionalità non venga attivata. Ciò dipende da due motivi: la tendenza di queste letture a occupare molto dello spazio riservato ai dati più importanti e la possibilità di gestirle in maniera più efficiente con i dischi rigidi. È possibile modificare questo comportamento per soddisfare i requisiti delle applicazioni caratterizzate da un accesso univoco ai dati o da diversi requisiti di livello di servizio. Vantaggi del tier virtuale dello storage Promozione in tempo reale dei dati attivi con elevata granularità. Di solito, un blocco di dati entra nel tier virtuale dello storage quando viene letto per la prima volta dal disco. È possibile ottenere vantaggi di performance in tempo reale poiché le successive letture vengono eseguite dal tier virtuale dello storage. Anche se vengono identificati schemi di comportamento per la lettura e i blocchi di dati più idonei vengono letti in anticipo, il tier virtuale dello storage non esegue mai movimenti di dati su larga scala da un tier di storage all'altro. In questo modo, è possibile ridurre al minimo l'utilizzo dell'I/O dei dischi rigidi e delle altre risorse di sistema. L'efficienza di questo approccio, insieme alla possibilità di operare con la granularità di un singolo blocco da 4 KB, consente di eseguire la promozione in tempo reale dei dati attivi. Utilizzando un AST basato sulla migrazione, i dati attivi vengono trasferiti da un tier di storage all'altro, come attività in background o attività pianificata durante ore di utilizzo più basso, in modo da ridurre al minimo il carico aggiuntivo del sistema storage. Poiché queste soluzioni utilizzano spesso un livello di granularità almeno 128 volte superiore a quello del tier virtuale dello storage (da 0,5 MB a 1 GB o persino di un intero volume o una LUN), lo spostamento dei dati può richiedere molto tempo. Questi tipi di approcci possono tralasciare picchi di attività importanti e di durata inferiore al tempo necessario per identificare i dati attivi e promuoverli. La granularità a 4 KB del tier virtuale dello storage garantisce un utilizzo molto efficiente dei supporti basati su Flash. È molto probabile che le soluzioni dotate di minore granularità includano numerosi dati "non attivi" in ciascun blocco di dati attivo, richiedendo un quantitativo maggiore di costosi supporti Flash per ottenere i medesimi risultati. Semplice da implementare e da gestire. Il tier virtuale dello storage è compatibile con i volumi di dati e le LUN esistenti. Non richiede complesse modifiche al vostro ambiente storage, né interruzioni operative. Non occorre definire policy, soglie o finestre temporali specifiche per lo spostamento dei dati. È sufficiente installare la tecnologia Flash nei vostri sistemi storage. Fatto ciò, il tier virtuale dello storage diventa attivo su tutti i volumi gestiti dallo storage controller. Quindi, se volete, potete escludere dal tier virtuale dello storage i dati utente dei volumi a priorità più bassa. Le altre soluzioni di AST richiedono policy incrementali, classificazione dei dati e modifiche strutturali all'infrastruttura storage esistente, come la creazione di pool storage dedicati e la migrazione dei dati. Completamente integrato. Il tier virtuale dello storage è completamente integrato nell'architettura storage unificata di NetApp e consente di utilizzare qualunque protocollo storage NAS o SAN senza apportare alcuna modifica. Inoltre, le soluzioni AST basate sulla migrazione non sono in grado di interoperare con le funzionalità di efficienza dello storage come la deduplica. Il tier virtuale dello storage agisce insieme a tutte le funzionalità di efficienza dello storage NetApp, come il thin provisioning, FlexClone®, la deduplica e la compressione, ottenendo un'efficace integrazione che offre notevoli vantaggi e consente di migliorare il funzionamento del tier virtuale dello storage. Ad esempio, se si deduplica un volume, i vantaggi di tale operazione saranno validi anche nel tier virtuale dello storage. Un singolo blocco del tier virtuale dello storage può essere utilizzato come destinazione di numerosi puntatori dei metadati, aumentando le probabilità di lettura ripetuta e il valore della promozione. Grazie a questo tipo di amplificazione della cache, un singolo blocco del tier virtuale dello storage può agire come molteplici blocchi logici. Ciò può offrire notevoli vantaggi in termini di performance per gli ambienti di virtualizzazione desktop e server, come la riduzione della durata degli avvii di massa, riducendo anche il quantitativo di supporti Flash necessari. Conclusioni Il nostro approccio all'AST basato sul caching offre al tier virtuale dello storage NetApp notevoli vantaggi rispetto all'AST basato sulla migrazione. Con il tier virtuale dello storage è possibile promuovere i dati in tempo reale, consentendo anche ai brevi picchi di attività di sfruttare i vantaggi garantiti dall'accelerazione. La granularità di 4 KB offerta da NetApp consente di escludere, in maniera molto efficiente, i dati meno attivi dalle unità Flash, richiedendo un numero inferiore di unità di questo tipo per ottenere buoni risultati. In confronto, l'AST basato sulla migrazione è meno granulare, richiede una maggiore latenza prima di eseguire la promozione dei dati, sfrutta una maggiore attività di I/O del disco rigido e utilizza in maniera meno efficiente le costose unità disco basate su Flash. Il tier virtuale dello storage utilizza i dischi rigidi come tier per la capacità e Flash come tier per le performance. Probabilmente state utilizzando numerosi tipi di unità disco, come FC, SATA e SAS. Tutti questi tipi di unità possono agire da tier per le capacità, mentre il tier virtuale dello storage fornisce le performance. Siamo convinti che la combinazione di un tier ad alte performance (basato sul tier virtuale dello storage) e di un singolo tier basato sulle unità disco (basato su unità SATA) sia la soluzione più logica per la maggior parte delle applicazioni presenti e future. Desiderate condividere le vostre opinioni sul tiering automatizzato dello storage?Le Community NetApp online consentono di porre domande, scambiare idee e condividere pensieri. Tech OnTap Per iscrivervi subito, visitate il sito Tech OnTap nella Community NetApp. | |
![]() | ![]() |
| Contatti | Come acquistare | Commenti | Opportunità di lavoro | Sottoscrizioni | Informativa sulla privacy | © 2011 NetApp |