Tech ONTAP de NetApp Logotipo de NetApp
Tech ONTAP de NetApp
     
Un vistazo a la compactación de datos inline de NetApp
Skip Shapiro
Skip Shapiro
Ingeniero de marketing técnico, All Flash FAS y flash de ONTAP
NetApp

En ONTAP® 9 de NetApp®, hemos añadido una nueva función de eficiencia de almacenamiento: la compactación de datos inline. Dado que este concepto es nuevo para la mayoría de las personas, he pensado que podría dedicar un espacio en este artículo para explicar el funcionamiento de la compactación y de qué manera interactúa con el resto de funciones de eficiencia de almacenamiento.

La compactación de datos inline actúa sobre los datos de forma cronológica, es decir, conforme los datos llegan a la controladora de almacenamiento. Cuando los datos están en la memoria de la controladora, cogemos bloques de datos que normalmente consumirían un bloque completo de 4 KB de almacenamiento físico y los compactamos. Gracias a la compactación, podemos incluir más de un bloque en un mismo bloque físico de 4 KB. Es como un problema de espacio en la maleta, en el maletero o en la mochila. Podemos tomar E/S que probablemente estén repletas de ceros o vaciar espacio, eliminar espacio vacío y aprovecharlo. Así funciona la compactación.

La compactación de datos inline tiene lugar durante el proceso de creación del punto de coherencia de ONTAP. Es como desmontar algo, parte de la operación Tetris: tengo estas E/S pequeñas. ¿Puedo combinar rápidamente dos o más E/S en un solo bloque físico antes de volcarlas en el soporte de almacenamiento? Se han registrado varias patentes de nuestra compactación de datos inline. El método que utilizamos es innovador. La compactación está habilitada por defecto en los sistemas All Flash FAS de NetApp, pero es una función opcional que puede habilitar en los sistemas FAS, tanto con agregados únicamente HDD como con agregados Flash Pool de NetApp. En cualquier caso, no existe ningún coste adicional por la compactación; está en el núcleo de ONTAP, como la compresión o la deduplicación.

La compactación es un componente de eficiencia de almacenamiento añadido. Es ortogonal a la deduplicación y constituye un complemento para la compresión adaptativa inline. En la compresión adaptativa inline, creamos grupos de compresión si el nivel de compresión de los datos supera el 50 %. Después de comprimir los datos, buscamos oportunidades para seguir comprimiendo los datos enlazando bloques pequeños o grandes con bloques pequeños en un único bloque físico. Como es parte del proceso del punto de coherencia, la compactación requiere muy poco uso del CPU, entre el 1 % y el 2 % como máximo. Nunca debería encontrarse en una situación en la que una controladora con un uso adicional de entre el 1 % y el 2 % le haga superar al límite. En ese caso, el sistema ya se habrá sobrecargado.

Aunque la compresión y la compactación funcionan bien en conjunto, no es obligatorio que funcionen juntas. Por ejemplo, un volumen que contiene muchos archivos pequeños puede ser un buen candidato para la compactación, pero no se beneficiará demasiado de la compresión.

Como es lógico, conforme los datos entran en la controladora de almacenamiento, lo siguiente será cómo funciona el proceso de eficiencia de almacenamiento (asumiendo que todas las opciones de eficiencia estén habilitadas):

  1. Lo primero es detectar los bloques que contienen ceros. Para esos bloques no escribimos nada, solo actualizamos los metadatos. Básicamente, estos bloques son un número de referencia.
  2. Después, aplicamos la compresión adaptativa inline. Este proceso resulta muy eficiente a la hora de determinar si el nivel de compresión de un bloque supera el 50 % o no. No desperdiciamos ciclos de CPU intentando comprimir material cuyo nivel de compresión es inferior al 49 % (no obtendríamos ningún ahorro tras la compactación).
  3. Entonces tiene lugar la deduplicación inline. Esta función se introdujo en ONTAP 8.3.2, donde únicamente se comparaban y deduplicaban inline los datos en la memoria. En ONTAP 9.0, hemos ampliado el tamaño del almacén hash de huella digital para incluir datos que se han escrito recientemente en el soporte de almacenamiento. Si desea maximizar el ahorro resultante de la deduplicación, recomendamos crear también una deduplicación en segundo plano (posproceso) en algún momento.
  4. El último paso es la compactación de datos. Los datos comprimidos a través de la compresión adaptativa o los datos que no se han examinado para la compresión son elegibles para la compactación. De esta manera, los archivos pequeños que no se hayan comprimido o los datos comprimidos en un 75 % o más a través de la compresión adaptativa inline son elegibles. El proceso de compactación enlaza y adapta dos o más bloques en un único bloque físico de 4 KB antes de enviarlo al almacenamiento. Cuanto más alta sea la tasa de compresión y más pequeños sean los archivos, más alta será la tasa de compactación. Así, podemos obtener efectos multiplicativos al combinar los bloques pequeños, la compresión y la compactación.

Probablemente no sea consciente del impacto que va a tener la compactación hasta que empiece a usarla. La compactación inline es un proceso heurístico en un punto de coherencia. Toma como muestras las primeras 100 E/S que aparezcan para calcular la tasa de compactación y, a continuación, aplica dicha tasa a los siguientes 100. Si la tasa de compactación aumenta, el proceso dice: “De acuerdo, asumiré una tasa mayor siguiendo adelante”. Si obtiene una tasa de compactación menor, reduce la tasa. Cuando llega el siguiente punto de coherencia, el proceso empieza de nuevo. Se trata de un proceso iterativo que busca el uso de CPU más bajo, pero la tasa de compactación más alta.

Figura 1) Las eficiencias de almacenamiento inline de NetApp se aplican como movimientos de datos a través de ONTAP stack.

Fuente: NetApp, 2016

Puede utilizar la compactación de datos inline como un proceso aislado (sin compresión o deduplicación) si así lo desea. Digamos que disponía únicamente de un entorno de archivos pequeños, es decir, archivos de 2 KB o menos. Esos archivos pequeños no se pueden comprimir y es poco probable que observe algún resultado tras la deduplicación. Sin embargo, la compactación de datos inline resultará en un ahorro del espacio cuando dos o más archivos se puedan almacenar en un bloque físico de 4 KB.

En términos de replicación de datos lógica, si los volúmenes de origen y destino tienen las mismas políticas de eficiencia habilitadas, se conservará el ahorro del espacio, sin ningún tipo de rehidratación. Un ejemplo es un sistema All Flash FAS con todas las eficiencias de almacenamiento habilitadas (opción por defecto) replicando a un sistema FAS que se utiliza como destino SnapVault® de NetApp. Si desea conservar el ahorro de espacio tras la deduplicación, la compresión adaptativa y la compactación de datos inline, debe habilitar todas las políticas en el sistema de destino también.

En cambio, si el sistema FAS de destino no tiene ninguna política de ahorro de espacio habilitada y está replicando desde un sistema All Flash FAS de ONTAP 9, los datos se inflarán al escribirse en el destino. Tampoco obtendrá bloques comprimidos, bloques deduplicados ni datos compactados. Si quiere conservar el ahorro de espacio, los volúmenes de origen y destino deben tener habilitadas las mismas políticas de eficiencia de almacenamiento. Además, recomendamos habilitar todas las eficiencias en los volúmenes de destino al replicar desde un sistema origen All Flash FAS; de esta manera, conservará el ahorro de espacio en el destino.

En resumen, la compactación de datos inline no altera los datos lógicos de ninguna manera; simplemente hemos ideado una forma de almacenar los datos más eficientemente. A menos que se encuentre en un entorno que solo contenga archivos pequeños, la mejor forma de pensar en la compactación es un multiplicador sobre la compresión adaptativa inline. Si no dispone de E/S completas, la compactación puede ayudarle. Con un uso reducido del CPU y más espacio libre para almacenar datos, la compactación de datos inline resulta muy sencilla para sistemas All Flash FAS.

Skip Shapiro es un ingeniero de marketing técnico, responsable de las tecnologías All Flash Fas, Flash Pool y Flash Cache de NetApp. Skip ofrecerá dos sesiones técnicas durante las conferencias de NetApp Insight® en Las Vegas y en Berlín. Para más información, consulte los siguientes enlaces:

NetApp Insight Las Vegas (26-29 de septiembre):
ONTAP 9 de NetApp: Rendimiento predecible en entornos de negocio con acuerdo de nivel de servicio
Análisis técnico de All Flash FAS

NetApp Insight Berlín (14-17 noviembre):
ONTAP 9 de NetApp: Rendimiento predecible en entornos de negocio con acuerdo de nivel de servicio
Análisis técnico de All Flash FAS

octubre 2016

 
Contacto   |   Cómo comprar   |   Comentarios   |   Empleo  |   Suscripciones   |   Política de privacidad   |   © 2016 NetApp