NetApp Tech OnTap

Consideraciones para sistemas de almacenamiento de gran capacidad

El rápido crecimiento del tamaño de disco ha hecho posible configurar sistemas de almacenamiento individuales con cantidades increíbles de almacenamiento. Por ejemplo, a NetApp FAS6080 le puede añadir 1.176 unidades de disco SATA de 1 TB y terminar con más de un petabyte (1.000 terabytes) de capacidad de almacenamiento básico en un solo sistema.

Para muchas tiendas de TI, las ventajas de los sistemas de gran capacidad son muy convincentes. Las unidades grandes suponen el precio más bajo por GB de almacenamiento. Más capacidad de menos spindles significa menos discos y sistemas de almacenamiento que gestionar, además de menos consumo de energía y menos requisitos de refrigeración; las principales preocupaciones en la mayoría de centros de datos.

Por tanto, ¿existe algún inconveniente? La verdad es que no, pero existen consideraciones importantes que se deben tener en cuenta a la hora de utilizar discos grandes. La capacidad de disco ha crecido mucho más rápido que la calidad o el rendimiento del disco. Puesto que los nuevos discos de mayor capacidad tienen las mismas probabilidades de fallar que los discos pequeños y el rendimiento es el mismo, la reconstrucción de un disco de 1TB con error es un poco como intentar llenar una piscina con una manguera. Prepárese para esperar un poco al prolongado proceso de reconstrucción.

Reconstrucciones que llevan más tiempo con discos SATA grandes no significa que no debería implementar sistemas de gran capacidad; sólo debe ser consciente de los requisitos únicos y las limitaciones que implican. En este artículo se explican los puntos que se deben tener en cuenta a la hora de considerar un sistema de gran capacidad, que son:

  • Aplicaciones que son adecuadas (y las que no lo son) para sistemas de gran capacidad
  • Disponibilidad de datos
  • Protección de datos
  • Reconstrucción RAID
  • Controles RAID y exploraciones en segundo plano
  • Aprovisionamiento
  • Complejidad de la infraestructura

La mayoría de puntos se aplica a cualquier sistema de almacenamiento de gran capacidad, pero también proporcionaré detalles para sistemas NetApp de gran capacidad.

NetApp's FAS6040

Aplicaciones de destino

Lo primero que se debe saber sobre sistemas de almacenamiento de gran capacidad es que pueden estar limitados por las características de rendimiento de las unidades subyacentes y que no son adecuados para todas las aplicaciones. Las unidades de mayor capacidad en el mercado son los discos SATA, más que las unidades Fibre Channel de alto rendimiento. Independientemente de la capacidad, los discos SATA actuales giran a la misma velocidad de rotación y ofrecen el mismo rendimiento. Además, para lograr el tamaño deseado en un contenedor de almacenamiento determinado (sistema de ficheros, LUN, etc.), deberá implementar menos discos, y eso en general implica un rendimiento máximo más bajo del contenedor de almacenamiento.

Además, los sistemas de almacenamiento y los sistemas operativos host pueden imponer límites de tamaño, lo que a su vez limita el número de spindles que se pueden usar para un contenedor de almacenamiento determinado. Por ejemplo, Ext3, el sistema de ficheros predeterminado de Linux®, tiene un tamaño máximo de 16 TB; por tanto, cuando se utilizan discos de 1 TB, un solo sistema de ficheros se debería limitar a unos 17 spindles a la hora de tener en cuenta una capacidad de pérdida para cosas como el formateado.

Cuando piensa en sistemas de gran capacidad, debe plantearse el almacenamiento secundario; estos sistemas no son adecuados para Exchange, bases de datos u otras aplicaciones que requieren tiempos de respuesta mínimos y un alto rendimiento. Entre las aplicaciones ideales se incluyen:

  • Backup de disco a disco
  • Objetivo de duplicación de datos (con NetApp SnapMirror®, por ejemplo)
  • Archivado de correo electrónico
  • Archivado de documentos o ficheros
  • Almacenamiento de conformidad

El almacenamiento secundario también se presta a aplicaciones que tienen grandes flujos de datos secuenciales, entre las que se incluyen:

  • Captura de imágenes
  • Captura de vídeo en directo
  • Datos sísmicos

Disponibilidad de datos

Puesto que pueden tener cientos de spindles SATA, existen algunos puntos importantes a tener en cuenta para la disponibilidad de datos en sistemas de gran capacidad. Son:

  • RAID
  • Configuraciones de alta disponibilidad
  • HA de múltiples rutas

Los índices de error para discos SATA generalmente son más elevados que para Fibre Channel, lo que hace fundamental la protección RAID. NetApp recomienda usar la implementación RAID 6 de doble paridad y alto rendimiento, RAID-DP™, para obtener protección frente a la pérdida de datos que se puede ocasionar a raíz de un fallo de disco doble en un grupo RAID. Otros proveedores pueden ofrecer soluciones RAID 6 de doble paridad según el producto de almacenamiento. Independientemente del proveedor, cualquier sistema de almacenamiento de gran capacidad se beneficiará a lo largo de la vida de la solución de la máxima resistencia de datos que proporciona RAID 6.

Aunque los sistemas de almacenamiento de gran capacidad generalmente se utilizan como almacenamiento secundario, los clientes de NetApp que los han implementado optan por configuraciones de alta disponibilidad completas con controladores “active-active” y sin puntos de error únicos para asegurarse de que los grandes almacenes de datos permanecen accesibles en todo momento. Un punto importante a tener en cuenta para una solución HA de gran capacidad es el tiempo necesario para que un controlador sustituya los discos del otro controlador o los restituya. Este tiempo puede ser ligeramente mayor con un número grande de discos SATA en la solución en comparación con el caso de que sólo fueran discos Fibre Channel. Esto ocurre porque los discos SATA son más lentos y los procesos de comprobación de rendimiento llevan más tiempo que a los discos Fibre Channel.

Data ONTAP® 7.2.4 introduce algunas optimizaciones específicas para las acciones de sustituir y restituir con discos SATA y puede mejorar el rendimiento de sistemas SATA de gran capacidad durante el fallo y la restitución, lo que equipara las soluciones con soluciones que emplean sólo discos Fibre Channel. Para beneficiarse de estas optimizaciones, NetApp recomienda el uso de Data ONTAP 7.2.4 o superior para cualquier solución de almacenamiento HA de gran capacidad basada en discos SATA.

Una opción de configuración de almacenamiento NetApp que se ha infrautilizado es HA de múltiples rutas. HA de múltiples rutas garantiza que existen dos rutas I/O individuales de cada controlador a cada disco, de forma que los problemas de conexión por cable u otros problemas de hardware no interrumpen el acceso a las unidades de disco. En las configuraciones de HA, estos problemas pueden ocasionar un fallo. HA de múltiples rutas reduce las posibilidades de que se produzca un fallo al proporcionar rutas de datos redundantes desde cada controlador a su almacenamiento. Además, HA de múltiples rutas puede ayudar a mejorar la consistencia del rendimiento al repartir la carga de trabajo del sistema de almacenamiento en dos rutas de datos.

Protección de datos

Realizar un backup de los datos de un sistema de almacenamiento de gran capacidad también presenta retos únicos. Se prefieren los métodos de disco a disco donde sea posible minimizar el tiempo de backup. No obstante, con herramientas como NetApp SnapVault® y SnapMirror, el tiempo necesario para crear una copia básica de un sistema de almacenamiento de gran capacidad puede ser prohibitivo. NetApp ofrece dos herramientas: LREP (duplicación lógica) y SnapMirror to Tape para ayudar en la creación de copias básicas que se pueden establecer en sistemas remotos. Después, sólo se duplican los bloques modificados, lo que reduce el impacto en los controladores de origen y destino, así como la red entre los dos.

Reconstrucción RAID

Como sucede con la mayoría de otras actividades de mantenimiento de sistemas, el tiempo necesario para la reconstrucción RAID se prolonga con unidades de disco SATA grandes. Por ejemplo, si un disco de 1 TB falla, la reconstrucción RAID en un sistema NetApp llevará aproximadamente entre 10 y 12 horas mientras no exista otra carga. Este tiempo será mayor a medida que aumenta la carga del sistema.

El tiempo medio actual entre datos de error (MTBF) sugiere que en un sistema de almacenamiento con 1.176 unidades de disco de 1 TB, un sistema podría tardar en la reconstrucción un 5% como máximo del tiempo necesario en condiciones operativas normales. Una vez más, el porcentaje de tiempo empleado en la reconstrucción es mayor a medida que aumenta la carga de trabajo global del sistema de almacenamiento.

Exploraciones de dispositivos y controles RAID

NetApp utiliza exploraciones de dispositivos y controles RAID de forma periódica como forma de garantizar la integridad de los datos almacenados, y yo pienso que otros proveedores de sistemas de almacenamiento ofrecen funciones similares para detectar y corregir problemas. Es algo muy parecido a pintar un gran puente, donde empiezas por un extremo, pintas cada día durante meses hasta que llegas al otro extremo y entonces empiezas de nuevo. Estas dos utilidades de NetApp sencillamente realizan un seguimiento del progreso y continúan trabajando a través del subsistema de almacenamiento hasta que se ha comprobado todo el almacenamiento. Las exploraciones de dispositivos en segundo plano se ejecutan de forma continua a un nivel bajo y emplean un diagnóstico integrado para detectar errores de dispositivos. Los controles RAID se ejecutan de forma predeterminada cada semana durante seis horas y emplean datos de paridad para comprobar la integridad de los datos.

En sistemas de almacenamiento de gran capacidad, NetApp recomienda aumentar el nivel de datos para exploraciones de dispositivos, e incrementar la frecuencia y la duración de la ejecución de controles RAID para garantizar que los datos a los se accede con poca frecuencia (típico en almacenamiento secundario) se comprueban de forma regular.

Aprovisionamiento de sistemas de almacenamiento

A la hora de aprovisionar un sistema de almacenamiento de gran capacidad, en primer lugar debe saber qué límites impone el sistema de almacenamiento (y los sistemas operativos host para entornos SAN) y planificar en consecuencia. Por ejemplo, en sistemas NetApp puede definir un máximo de 100 agregados o volúmenes tradicionales en un solo controlador de almacenamiento, pero el número total de agregados, volúmenes tradicionales y volúmenes flexibles (volúmenes FlexVol®) no puede superar los 500. Aunque estos pueden parecer límites altos, hay situaciones en las que se pueden superar. Por ejemplo, si el sistema operativo host le limita a sistemas de ficheros de 2 TB, o si se ha estandarizado en un número alto de volúmenes FlexVol por agregado, podría potencialmente realizar ejecuciones en el límite de 500 contenedores antes de aprovisionar al completo un sistema de capacidad máxima.

El tema es que cuando se trabaja con sistemas de almacenamiento de gran capacidad, no puede llegar y empezar con el aprovisionamiento. Tiene que saber cuáles los diversos límites de almacenamiento y hacer la planificación inicial necesaria para garantizar que puede usar toda la capacidad al tiempo que deja espacio para los requisitos futuros imprevistos.

Complejidad de la infraestructura

Un factor que no se debe pasar por alto a la hora de planificar la implementación de un sistema de gran capacidad es la complejidad de toda la infraestructura de discos. Hace poco trabajé con un cliente que tenía 1.008 discos en 72 estantes de disco. Estos, además, estaban divididos en 12 dispositivos de almacenamiento, cada uno con 6 estantes.

En un entorno “active-active” con una conectividad de almacenamiento HA de múltiples rutas, cada dispositivo de almacenamiento requiere 4 conexiones, lo que resulta en 48 conexiones entre almacenamiento y controladores de almacenamiento en numerosas carcasas.

Conclusión

Al conocer las posibles limitaciones y eligiendo las aplicaciones con sensatez, puede implementar sin problemas sistemas de almacenamiento con capacidades que hasta hace unos cuantos años habría sido imposible. Si tiene en cuenta las necesidades de protección de datos y disponibilidad en cuanto a capacidad frente rendimiento de las últimas unidades de disco SATA y planifica con antelación los requisitos físicos y de aprovisionamiento, puede evitar las sorpresas desagradables que se originan al trabajar con cualquier tecnología y beneficiarse de una gestión simplificada, costes directos de almacenamiento reducidos y menos requisitos de energía y refrigeración.

Chris Lueth Chris Lueth
Ingeniero técnico de marketing
NetApp

Chris tiene más de 17 años de experiencia en el sector. Desde que se unió a NetApp hace cinco años, ha obtenido una increíble andadura técnica, que incluye su trabajo en implementaciones NearStore®, RAID-DP, SnapLock®, plataformas de nivel intermedio y alto, y resistencia de los sistemas de almacenamiento. Anteriormente fue ingeniero de diseño de chips y trabajó en el primer chipset de placa madre de multiprocesador antes de pasar a la administración de sistemas UNIX® y después a sistemas de almacenamiento.

Comente sobre este artículo
Explore