NetApp Tech OnTap Logotipo de NetApp
NetApp Tech OnTap
     
Segmentación automatizada del almacenamiento
y almacenamiento virtual por niveles de NetApp

Las tecnologías de segmentación automatizada del almacenamiento (Automated Storage Tiering, AST) están principalmente concebidas para que los centros de datos puedan beneficiarse del rendimiento mejorado de los medios basados en Flash, al mismo tiempo que minimizan los costes y la complejidad. Los dispositivos basados en Flash, como los discos de estado sólido (SSD) basados en controladoras con tecnología Flash, pueden realizar entre 25 y 100 veces más operaciones de lectura aleatoria por segundo que las unidades de disco duro más rápidas (HDD). Sin embargo, el coste de ese rendimiento es entre 15 y 20 veces superior por gigabyte. Las unidades de disco duro siguen mejorando en cuanto a capacidad, pero su rendimiento en lo que respecta a IOPS por dólar está relativamente estancado. La tecnología Flash ofrece un número considerablemente superior de IOPS por dólar, además de una latencia menor.

La serie FAS6200.

Figura 1) Comparación de la eficiencia de lectura aleatoria de diferentes tipos de medios de estado sólido y rotacionales en una escala logarítmica. Tenga en cuenta que, en la relación de IOPS por dólar hay relativamente poca diferencia entre los diversos tipos de unidades de disco duro.

En lugar de ubicar permanentemente un conjunto de datos completo en un medio de elevado coste, la segmentación automatizada del almacenamiento intenta identificar y almacenar los datos activos en los medios de almacenamiento de mayor rendimiento y los datos inactivos en medios más lentos y de menor coste.

Para diseñar una solución óptima, NetApp ha dedicado mucho tiempo y energía en comprender los problemas que deben solventar las tecnologías AST.

Este artículo describe:

  • Criterios para evaluar las tecnologías AST
  • Métodos de AST basada en migración frente a la basada en almacenamiento en caché
  • La segmentación automatizada del almacenamiento de NetApp® (VST, Virtual Storage Tier), un método de AST basada en almacenamiento en caché

Evaluación de la tecnología AST

En cuanto a la actividad de I/O, el objetivo principal de la tecnología AST es mover tantas operaciones de I/O aleatorias como sea posible a medios de alto rendimiento (Flash) para minimizar la carga operativa de las operaciones de I/O aleatorias en las unidades de disco duro y reducir la latencia media. La distinción entre I/O aleatorias y secuenciales es importante, pues la ventaja de precio/rendimiento de la tecnología Flash frente a las unidades de disco duro es relativamente pequeña en las operaciones secuenciales de lectura y escritura (porque las unidades de disco duro son muy eficientes al procesar I/O secuenciales).

La serie FAS6200.

Figura 2) Comparación de la eficiencia del rendimiento en operaciones secuenciales de diferentes tipos de medios de estado sólido y rotacionales.

Existen varios factores que afectan a la capacidad de una solución de AST para alcanzar el objetivo arriba indicado:

  • ¿Cuál es la granularidad de la colocación de datos? Cuanto menor sea la cantidad de datos en los que trabaja, con mayor eficiencia usará la solución los recursos del sistema y las unidades de disco duro para colocar los datos y, además, habrá menos probabilidades de que se «cuelen» datos inactivos con los activos y consuman inútilmente medios de elevado coste.
  • ¿Cómo se identifican los datos activos y cuánto se agilizan? Cuanto más rápido lleguen los datos activos al medio Flash, menos probable será que se obvien picos relativamente breves en la actividad de I/O, menor será la actividad de I/O requerida en las unidades de disco duro y mayor será la mejora en la latencia media.

Desde un punto de vista operativo, existen varios factores adicionales que se deben considerar:

¿Qué dificultad entraña la puesta en marcha y gestión de la solución? Una solución de AST que requiera una importante reconfiguración para su puesta en marcha, o un elevado nivel de supervisión y gestión, puede ser contraproducente.

¿Cómo se integra la solución con el resto de tecnologías de almacenamiento que utiliza (backup, deduplicación, thin provisioning, etc.)? No le interesa poner en marcha una solución para luego descubrir que sus backups no funcionan o que provocan grandes movimientos de datos.

Migración frente a almacenamiento en caché para AST

Existen dos métodos de AST totalmente diferentes: migración y almacenamiento en caché.

El método de AST basada en migración automatiza el proceso de migración de datos. Cuando se identifica un grupo de datos como «activos», ese grupo se mueve a medios más rápidos y, cuando se vuelven inactivos, se vuelven a mover a medios más lentos. Se requiere acceso a las unidades de disco duro tanto para introducir como para sacar los datos del medio Flash.

El método de AST basada en almacenamiento en caché usa métodos rentables de almacenamiento en caché para «transferir» los datos activos a medios de alto rendimiento. Como una copia de los datos permanece en la unidad de disco duro, cuando estos se vuelven inactivos, es posible sacarlos simplemente de la caché sin necesidad de realizar ninguna operación adicional de I/O en la unidad de disco duro.

La serie FAS6200.

Figura 3) Segmentación automatizada del almacenamiento basada en almacenamiento en caché frente a la basada en migración.

Almacenamiento virtual por niveles de NetApp

NetApp analizó estos dos métodos de AST considerando los criterios de evaluación que hemos tratado anteriormente y llegó a la conclusión de que este método, basado en almacenamiento en caché responde mejor ante estos criterios.

NetApp pudo centrarse en optimizar el rendimiento de la actividad de lectura, ya que el sistema de archivos WAFL® de NetApp (Write Anywhere File Layout) transforma de manera efectiva la actividad de escritura en escritura secuencial, algo en lo que las unidades de disco duro son muy eficientes, como muestra la figura 2. Este aspecto se explica detalladamente en una reciente publicación en un blog de Mike Riley y John Fullbright, colaborador de Tech OnTap®. (Esta es también la razón por la que el RAID de doble paridad o RAID-DP® de NetApp, logra un buen rendimiento de escritura donde otras implantaciones de RAID 6 no).

La serie FAS6200.

Figura 4) El almacenamiento virtual por niveles por niveles de NetApp es un método de segmentación automatizada del almacenamiento basada en almacenamiento en caché.

El almacenamiento virtual por niveles de NetApp transfiere los datos activos a la caché al mismo tiempo que mantiene la carga de I/O en las unidades de disco duro al mínimo nivel. Cada vez que se recibe una solicitud de lectura de un bloque en un volumen o una LUN, ese bloque se transfiere automáticamente. Tenga en cuenta que la transferencia de un bloque de datos no es una migración, pues el bloque permanece en la unidad de disco duro después de copiarlo en el almacenamiento virtual por niveles. La transferencia de los datos se realiza directamente desde la caché del búfer del sistema, por lo que no se genera ninguna operación adicional de I/O en la unidad de disco duro.

Como los bloques de datos se pueden transferir inmediatamente después de la primera lectura en el disco, no se genera actividad de I/O adicional en el disco. En cambio, las implantaciones de AST basada en migración normalmente no mueven los datos activos hasta que se han leído varias veces en el disco o hasta la siguiente migración programada y, entonces, se genera una actividad de I/O adicional en el disco para realizar el proceso de migración.

Los algoritmos de NetApp distinguen los datos valiosos de los menos importantes y los conservan en el almacenamiento virtual por niveles. Los metadatos, por ejemplo, se transfieren siempre con la primera lectura. En cambio, las lecturas secuenciales normalmente no se conservan en el almacenamiento virtual por niveles a no ser que se active específicamente este procedimiento, porque suelen desplazar los datos de más valor y, como hemos visto, las unidades de disco duro pueden asumir bien estas operaciones. Puede cambiar este comportamiento para responder a los requisitos de las aplicaciones que acceden a los datos una única vez o para satisfacer diferentes requisitos de nivel de servicios.

Ventajas del almacenamiento virtual por niveles

Transferencia en tiempo real de datos activos con alta granularidad. Normalmente, un bloque de datos entra en el almacenamiento virtual por niveles la primera vez que se lee en el disco. Las ventajas en el rendimiento se producen en tiempo real, a medida que se realizan las siguientes lecturas en el almacenamiento virtual por niveles. Se identifican los patrones del comportamiento de lectura y se leen con antelación los bloques de datos que pueden ser necesarios, pero el almacenamiento virtual por niveles nunca hace un movimiento completo de datos de un nivel de almacenamiento a otro. De este modo se minimiza la actividad de I/O en las unidades de disco duro y el uso de otros recursos del sistema. La eficiencia de este método, combinada con la capacidad de funcionar con la granularidad de un único bloque de 4 KB, permite transferir los datos activos en tiempo real.

Con una AST basada en migración, la migración de los datos activos de un nivel de almacenamiento a otro se realiza como tarea en segundo plano o de forma programada durante las horas de menor actividad (para minimizar la carga adicional en el sistema de almacenamiento). Como estas soluciones suelen funcionar con un nivel de granularidad como mínimo 128 veces superior que el del almacenamiento virtual por niveles (de 0,5 MB a 1 GB o incluso un volumen o una LUN completos), el movimiento de datos puede llevar una cantidad considerable de tiempo. Estos métodos pueden omitir picos importantes de actividad, si su duración es inferior al tiempo necesario para identificar y mover los datos activos.

La granularidad de 4 KB del almacenamiento virtual por se debe a que utiliza medios basados en Flash de manera muy eficiente. Las soluciones con peor granularidad pueden mezclar más datos «inactivos» con cada bloque de datos activos y, por lo tanto, pueden requerir una cantidad mayor de medios Flash de elevado coste para proporcionar los mismos resultados.

Puesta en marcha y gestión sencillas. El almacenamiento virtual por niveles funciona con los volúmenes de datos y las LUN existentes. No requiere ningún cambio complicado o que provoque interrupciones en el entorno de almacenamiento. Tampoco es necesario establecer normativas, umbrales ni márgenes de tiempo para el movimiento de datos. Simplemente tiene que instalar la tecnología Flash en sus sistemas de almacenamiento. Una vez realizada esta tarea, el almacenamiento virtual por niveles se encuentra activo para todos los volúmenes que gestiona la controladora de almacenamiento. A continuación, si lo desea, puede excluir del almacenamiento virtual por niveles los datos de usuario, para dejarlos en volúmenes de menor prioridad.

Otras soluciones de AST requieren normativas incrementales, clasificación de datos y cambios estructurales en la infraestructura de almacenamiento existente, como la creación de pools de almacenamiento dedicados y migración de datos.

Totalmente integrado. El almacenamiento virtual por niveles está totalmente integrado en la arquitectura de almacenamiento unificado de NetApp, lo que significa que puede usarlo con cualquier protocolo de almacenamiento NAS o SAN sin realizar ningún cambio.

Además, es posible que las soluciones de AST basada en migración no puedan interactuar con funciones de eficiencia del almacenamiento como la deduplicación. El almacenamiento virtual por niveles de NetApp funciona en combinación con todas las funciones de eficiencia del almacenamiento de NetApp, incluidas thin provisioning, la tecnología FlexClone®, deduplicación y compresión. Esta estrecha integración es beneficiosa para usted y mejora el funcionamiento del almacenamiento virtual por niveles.

Por ejemplo, cuando deduplica un volumen, las ventajas de la deduplicación persisten en el almacenamiento virtual por niveles. Un único bloque en el almacenamiento virtual por niveles podría tener muchos punteros de metadatos que lo señalan, con lo que aumenta la probabilidad de que se vuelva a leer ese bloque y, a su vez, acrecienta la importancia de la transferencia de ese bloque. Con esta amplificación de caché un único bloque del almacenamiento virtual por puede servir como varios bloques lógicos. Esto puede traer importantes ventajas en cuanto a rendimiento en entornos de virtualización de servidores y puestos de trabajo (como la reducción de la duración de los arranques simultáneos masivos) al mismo tiempo que disminuye la cantidad de medios Flash necesarios.

Conclusión

Nuestro método de AST basada en almacenamiento en caché aporta importantes ventajas al almacenamiento virtual por niveles de NetApp en comparación con las soluciones de AST basada en migración. El almacenamiento virtual por niveles puede transferir datos en tiempo real, de modo que incluso los breves picos de actividad se benefician de la aceleración. Nuestra granularidad de 4 KB señala que conseguimos excluir los datos inactivos del medio Flash de manera muy eficiente, por lo que necesitará menos medios Flash para obtener un buen resultado. En comparación, las soluciones de AST basada en migración son menos granulares, tienen una mayor demora antes de mover los datos, requieren más actividad de I/O en las unidades de disco duro y usan medios basados en Flash de elevado coste de un modo menos eficiente.

De hecho, el almacenamiento virtual por niveles usa unidades de disco duro como nivel de capacidad y medios Flash como nivel de rendimiento. Seguramente dispone de diferentes tipos de unidades de disco, como FC, SATA y SAS. Todos estos tipos se pueden utilizar como nivel de capacidad, mientras el almacenamiento virtual por niveles se encarga del rendimiento. Creemos que la combinación de un nivel de alto rendimiento (basado en el nivel de almacenamiento virtual) y un único nivel de unidades de disco (basado en discos SATA) es la mejor opción para la mayoría de las principales aplicaciones.

 ¿Qué opina sobre la segmentación automatizada del almacenamiento?

Formule preguntas, intercambie ideas y comparta sus opiniones en las comunidades en línea de NetApp.

Paul Feresten
Director Ejecutivo Director de Marketing de Productos
NetApp


Paul se unió a NetApp en 2005 y se especializó en los principales productos de software de NetApp, como Data ONTAP®, MultiStore®, FlexClone y thin provisioning. Tiene más de 30 años de experiencia en el sector, donde ha desempeñado funciones de gestión de producto, ventas, marketing y dirección ejecutiva. Antes de entrar a formar parte de NetApp, Paul trabajó en Data General, Digital Equipment Corporation, MSI Consulting y SEPATON.



Rajesh Sundaram
Director Técnico
NetApp


Desde que se unió a NetApp, en 1997, Rajesh ha trabajado en el sistema de archivos WAFL, en el subsistema RAID de Data ONTAP y en la integración de la tecnología Flash en el almacenamiento de NetApp. Ha cursado estudios de posgrado en Informática en la Universidad de Arizona.


Tech OnTap
Suscríbase ahora
Tech OnTap ofrece reportajes mensuales, acceso exclusivo a mejores prácticas, sugerencias y herramientas reales, entrevistas técnicas exclusivas, demostraciones, evaluaciones de expertos y muchas cosas más.

Visite Tech OnTap en la comunidad de NetApp y suscríbase hoy mismo.

En profundidad
En profundidad
Más información sobre VST

¿Desea recibir más información sobre VST? Un documento técnico publicado recientemente contiene todos los detalles al respecto e incluye información sobre el rendimiento medido en diferentes entornos.


Puestos de trabajo virtuales y VST

El almacenamiento virtual por niveles de NetApp tiene un tremendo impacto en los entornos de puestos de trabajo virtuales. Una publicación reciente en un blog de Vaughn Stewart describe las cargas extremas que estos entornos pueden crear y explica cómo puede VST reducir el número de discos y aumenta el número de puestos de trabajo que puede admitir un entorno de almacenamiento al mismo tiempo que aumenta el rendimiento de los datos.


Almacenamiento en caché inteligente

Flash Cache disminuye los costes de almacenamiento al reducir el número de discos necesarios para un determinado nivel de rendimiento hasta en un 75% y al permitir la sustitución de discos de alto rendimiento por otras opciones más económicas. Obtenga más información sobre esta revolucionaria tecnología.

En profundidad
 
TRUSTe
Póngase en contacto con nosotros   |   Cómo comprar   |   Comentarios   |   Empleo  |   Suscripciones   |   Política de privacidad   |   © 2011 NetApp