NetApp Tech OnTap

Caso práctico: Aumento de la eficiencia del almacenamiento con deduplicación, Thin Provisioning y FlexClone

Nuestro trabajo en San Diego Data Processing Corporation (SDDPC) es satisfacer las necesidades de TI de distintas organizaciones de la ciudad y el condado con la máxima eficiencia posible. Desde 1999 recurrimos principalmente a NetApp para satisfacer nuestras necesidades de almacenamiento y, en la actualidad, tenemos más de 300 TB de almacenamiento NetApp®.

En los años transcurridos desde que adquirimos nuestro primer sistema de NetApp, hemos avanzado con rapidez para adoptar las últimas tecnologías de NetApp con el fin de mejorar la eficiencia y reducir los costes. Por ello, cuando Tech OnTap me pidió que escribiese un artículo sobre la eficiencia del almacenamiento para el número especial de este mes, me vinieron a la mente varias de las tecnologías clave que utilizamos en el día a día:

  • La deduplicación para nuestro entorno VMware® y los home directories nos permite ahorrar un 65% de espacio.
  • El Thin Provisioning en todos los volúmenes reduce nuestros requisitos de almacenamiento un 27% o más.
  • El uso de FlexClone® en nuestro entorno de desarrollo y pruebas nos permite recuperarnos de los errores de programación en cuestión de segundos, sin consumir almacenamiento adicional.

Juntas o por separado, estas tecnologías reducen la cantidad total de espacio que se necesita, lo que disminuye a su vez los requisitos de alimentación, refrigeración y espacio.

Deduplicación para VMware y home directories

Probablemente ya habrá leído mucho sobre la deduplicación de NetApp en Tech OnTap, por lo que no me voy a entretener mucho en explicar la tecnología. En SDDPC, estamos satisfechos con la deduplicación de NetApp porque se puede aplicar al almacenamiento primario, se puede utilizar con cualquier protocolo de almacenamiento (NFS, CIFS, iSCSI, FC), resulta transparente para las aplicaciones y se integra en Data ONTAP®, por lo que no implica ningún coste adicional.

Ahorro de espacio habitual gracias a la deduplicación en distintas aplicaciones.

Figura 1) Ahorro de espacio habitual gracias a la deduplicación en distintas aplicaciones.

Actualmente, utilizamos la deduplicación para nuestro entorno VMware (encontrará más información sobre nuestro esfuerzo de virtualización en un caso de cliente reciente) y también en nuestros home directories. En VMware, 19 de nuestros 25 servidores ESX 3.5 VMware acceden al almacenamiento NetApp a través de NFS; algunos de los otros están conectados al almacenamiento NetApp por FC. Al deduplicar nuestro entorno VMware, conseguimos un ahorro de espacio de un 65%. Es decir, sólo utilizamos un poco más de un tercio del espacio para VMware del que habríamos necesitado sin la deduplicación.

También tenemos la deduplicación activada para cinco volúmenes de home directories. El ahorro de espacio de estos volúmenes varía entre un 12% y un 30%.

Para nuestros volúmenes de home directories, hemos configurado la deduplicación de NetApp para que se ejecute automáticamente cada vez que esos volúmenes aumenten un 20%; para nuestro entorno VMware, como los datos no cambian con mucha frecuencia, ejecutamos el proceso de deduplicación una vez a la semana, cada domingo por la noche.

Con unos sencillos comandos, se puede determinar cuántos datos se han procesado, cuándo fue la última vez que se ejecutó la deduplicación y cuánto espacio se está ahorrando.

A largo plazo, activaremos la deduplicación para más aplicaciones (como los archivos de Exchange) a medida que vayamos también actualizando el Data ONTAP en los sistemas de almacenamiento que llevan cierto tiempo instalados. En última instancia, tenemos previsto ejecutar la deduplicación prácticamente en todos lados, con la posible excepción de las aplicaciones que tienen los mayores I/Os y los menores requerimientos de latencia, aunque, a decir verdad, el impacto que hemos podido observar en el rendimiento ha sido mínimo (un pequeño porcentaje en la lectura y ninguna repercusión en las operaciones de escritura).

Si se pregunta si sus conjuntos de datos se pueden beneficiar de la deduplicación, NetApp ofrece una herramienta para calcular el ahorro de espacio espacio (SSET: Space Savings Estimation Tool) que explorará el volumen NFS o CIFS y calculará cuánto espacio puede ahorrar; esto le ayudará a decidir si merece la pena deduplicar o no un volumen determinado.

Thin Provisioning en todos los entornos

Thin Provisioning es otra tecnología de NetApp que utilizamos para mejorar la eficiencia del almacenamiento. Al igual que ocurre en la mayoría de los departamentos de TI, nuestros administradores de aplicaciones casi siempre calculan en exceso la cantidad que almacenamiento que necesitarán para una nueva aplicación. Un administrador puede que solicite 1 TB para luego acabar necesitando sólo 100 GB. El Thin Provisioning nos permite presentarles un volumen de 1 TB sin asignar ni comprometer el almacenamiento de antemano. Por esta razón, lo aplicamos a todos nuestros volúmenes de almacenamiento desde el primer día.

Al utilizar Thin Provisioning en combinación con la capacidad de aumentar o disminuir los volúmenes FlexVol® de NetApp sobre la marcha, disponemos de mucha más flexibilidad de la que tendríamos con el almacenamiento tradicional. Podemos presentar a un administrador el terabyte de volumen que ha solicitado, con la tranquilidad de saber que ese almacenamiento sólo se consumirá cuando se utilice. Si se aplica Thin Provisioning a varios volúmenes de un sistema de almacenamiento, todos los volúmenes extraerán el almacenamiento de un único pool de almacenamiento según sea necesario.

Thin Provisioning

Figura 2) Ilustración del efecto de Thin Provisioning de NetApp.

En la práctica, aunque hayamos aplicado Thin Provisioning a un volumen, normalmente esperamos a que se estabilice el uso del almacenamiento de la nueva aplicación y, entonces, reducimos el volumen de modo que la aplicación tenga un búfer del 20-30% sobre el uso real. Así, nunca asignamos en exceso y nos aseguramos de que ninguna aplicación pueda consumir todo el espacio libre disponible en un agregado.

A pesar de esta postura conservadora, nuestro uso de Thin Provisioning, demuestra un ahorro impresionante en varios aspectos. Para nuestros volúmenes de bases de datos (tanto de Oracle® como de Microsoft® SQL Server™) presentamos un total de 4,7 TB, pero el espacio asignado en realidad es de sólo 3,4 TB, por lo que nuestro requisito de almacenamiento se reduce en un 27% aproximadamente con respecto al provisionamiento tradicional.

En el caso de nuestros home directories, actualmente tenemos un ahorro moderado del 13% con Thin Provisioning. Esto se debe en parte a que hemos reducido considerablemente el tamaño de estos volúmenes para satisfacer las necesidades reales. La situación también es algo más complicada ya que, por motivos históricos, estos volúmenes estaban configurados como LUN montadas por nuestros servidores de impresión y de ficheros Windows® con iSCSI. Thin Provisioning actúa en las LUN de manera similar que en los volúmenes NAS. Sin embargo, para obtener el máximo beneficio, hay que reclamar espacio periódicamente para cada LUN, como ya se describió con más detalle en un artículo Tech OnTap anterior.

También creemos que el Thin Provisioning presenta una sinergia excelente con la deduplicación.

Por ejemplo, uno de nuestros entornos VMware tiene más de 100 equipos virtuales en 4 servidores ESX 3.5 que utilizan volúmenes con Thin Provisioning, lo que supone una capacidad total de 1,8 TB. Sin embargo, nuestra capacidad total utilizada es de sólo 841 GB, lo que significa que realmente sólo se utiliza el 41% de la capacidad provisionada.

En este caso, hemos dejado un búfer algo mayor, porque nuestro entorno VMware está aumentando a un ritmo muy rápido. Además, el software SnapManager® para infraestructuras virtuales (SMVI) de NetApp utiliza la tecnología Snapshot de VMware dentro del proceso de captura de una copia Snapshot™ coherente de NetApp. Aunque SMVI no conserva los snapshots de VMware durante mucho tiempo, reservamos el espacio adicional para almacenar los ficheros diferenciales de VMware que se derivan del uso de SMVI o para otras circunstancias en que podríamos necesitar un snapshot de VMware.

Tenga en cuenta que, con la deduplicación, ya habíamos reducido nuestro espacio de almacenamiento de VMware en un 65% y ahora, con Thin Provisioning, lo reducimos un 59% más de lo que se podría con el provisionamiento tradicional. Conforme vayamos ampliando el uso de la deduplicación, esperamos poder aprovechar aún más el Thin Provisioning y el redimensionamiento de volúmenes para recuperar espacio adicional.

FlexClone para desarrollo y prueba

Por último, para exprimir aún más la eficiencia del almacenamiento de nuestro almacenamiento NetApp, aplicamos FlexClone® a nuestro entorno SAP® de pruebas y desarrollo. Cuando el desarrollo se encuentra a pleno rendimiento, de media recibo cinco solicitudes a la semana para restaurar un entorno de desarrollo en el que algún código sin identificar ha dañado una aplicación.

Con el backup en cinta tradicional, habría tenido que localizar el backup del entorno de la noche anterior y restaurarlo desde la cinta, lo que retrasaría al desarrollador un día entero y haría perder horas de mi tiempo y del desarrollo posterior. Con NetApp, cada cuatro horas creamos una copia Snapshot de todos los equipos virtuales que se emplean en el desarrollo. Cuando recibo una solicitud de restauración, no tengo más que localizar el entorno de desarrollo correcto en la copia Snapshot más reciente, crear un volumen FlexClone de ese volumen, registrar el equipo virtual clonado como un equipo virtual nuevo y reiniciarlo. Este proceso tarda minutos y el desarrollador puede retomar su actividad con una pérdida de tiempo mínima.

La eficiencia del almacenamiento entra en juego si pensamos que un entorno de desarrollo típico suele tener unos 450 GB. Si tuviera que restaurar 5 entornos similares en una semana utilizando los métodos tradicionales, necesitaría 2 TB de espacio adicional en disco. Con FlexClone, consigo lo mismo sin consumir nada de espacio adicional en disco.

Conclusión

De por sí, cada una de estas tecnologías ofrece grandes avances en cuanto a eficiencia del almacenamiento. Como ya hemos visto, la deduplicación nos ayuda a recuperar hasta un 65% de espacio de almacenamiento; los procesos de Thin Provisioning, incluso con una actitud conservadora, nos ahorran un 30% o más, y FlexClone nos permite recuperarnos con rapidez sin que sea necesario almacenamiento adicional. Según nuestros cálculos, la eficiencia del almacenamiento NetApp ha reducido en total nuestros requisitos de adquisición de almacenamiento
en 5 TB como mínimo, lo que supone un ahorro significativo de costes de capital, costes de gestión continua y refrigeración.

Pero quizá sea aún más importante la forma en que las tecnologías de NetApp interaccionan. Con la deduplicación, el Thin Provisioning y el redimensionamiento de volúmenes, se pueden reducir significativamente los requisitos de almacenamiento, pero además, si se deduplica un volumen, el ahorro de espacio se hereda automáticamente al replicar el volumen con SnapMirror® de NetApp, con el consiguiente ahorro de espacio de almacenamiento y de ancho de banda.

Por ejemplo, en un reciente proyecto piloto, utilizamos SnapMirror para replicar nuestros equipos virtuales (ya deduplicados) en una segunda ubicación. A continuación, utilicé FlexClone de NetApp para clonar todos los equipos virtuales replicados para poner a prueba la función de recuperación ante desastres resultante, sin tener que usar ningún espacio de almacenamiento adicional ni interrumpir el programa de replicación. Aunque aún no hemos puesto en práctica este esquema de recuperación ante desastres, la eficiencia que NetApp ofrece hace que resulte más económico
(y, por lo tanto, más viable) de lo que sería sin ella.

¿Qué opina sobre la eficiencia del almacenamiento NetApp?

Formule sus preguntas, intercambie ideas y comparta sus opiniones en las comunidades online de NetApp.

Rick Scherer

Rick Scherer
Administrador de sistemas UNIX
San Diego Data Processing Corporation

Desde su incorporación a SDDPC en 2001, Rick ha demostrado conocimientos especializados en diversas áreas que sobrepasan los límites de su cargo, incluido Windows, diseño de redes, seguridad, SAP y VMware. Desde que obtuvo la certificación VCP en 2006, ha trabajado para implementar un entorno virtual sólido en SDDPC, con 25 servidores VMware y más de 300 equipos virtuales que ejecutan aplicaciones esenciales para los negocios, como SAP NetWeaver®, Microsoft SQL Server, Symantec™ Altiris y Citrix Presentation Server. Rick lleva trabajando con almacenamiento NetApp desde 1999.

En profundidad