NetApp Tech OnTap

Cinco innovadores consejos para aumentar la resistencia de un sistema de almacenamiento NetApp

A lo largo de los años, los sistemas de almacenamiento NetApp se han creado una reputación por ser sencillos y fáciles de gestionar y por su resistencia a los problemas que pueden influir en la disponibilidad de los datos. Para lograr los niveles más altos de resistencia, se deben seguir las mejores prácticas.

NetApp publicó recientemente un informe técnico que ofrece los detalles completos de las mejores prácticas de almacenamiento en cuanto a resistencia. En este artículo se incluyen unos cuantos consejos que puede utilizar para mejorar la resistencia de un sistema de almacenamiento NetApp:

  • Utilice alta disponibilidad de múltiples rutas (HA multiruta).
  • Proporcione el número adecuado de unidades de disco adicionales.
  • Utilice SyncMirror® para obtener una mayor resistencia.
  • Defina las configuraciones de HA para actualizaciones sin interrupciones.
  • Compruebe la configuración del sistema de almacenamiento mediante las herramientas automatizadas de NetApp.

Consejo 1: Utilice alta disponibilidad de múltiples rutas.

La alta disponibilidad (HA) de múltiples rutas proporciona rutas redundantes entre discos y controladores de almacenamiento para configuraciones de un solo controlador y “active-active”. Tener una segunda ruta para lograr almacenamiento puede proteger frente a diversos fallos posibles, como:

  • Fallo de puerto o HBA
  • Fallo de cable de controlador a estante
  • Fallo de módulo de estante
  • Fallo de cable entre estante doble
  • Fallo de ruta secundaria en configuraciones de HA
Multipath HA in an active-active controller configuration.

Figura 1) HA de múltiples rutas en una configuración de controlador “active-active”.

Incluso con sistemas de almacenamiento NetApp en clústeres (configuraciones “active-active” o HA), HA de múltiples rutas reduce la posibilidad de que se produzca un fallo y mejora la disponibilidad.

Además, HA de múltiples rutas ofrece beneficios de rendimiento potenciales en situaciones en las que las rutas Fibre Channel a estantes de disco están sobrecargadas suministrando dos veces el ancho de banda al sistema de almacenamiento. Esto puede resultar valioso sobre todo cuando tiene lugar una reconstrucción y en sistemas antiguos que usan conexiones Fibre Channel de 1Gbit/s.

En muchos casos, puertos FC abiertos ya están disponibles en sistemas de almacenamiento; por tanto, se puede agregar HA de múltiples rutas al precio de unos cables. Esto es un precio bajo a pagar a cambio de grandes beneficios en resistencia.

Consejo 2: Proporcione el número adecuado de unidades de disco adicionales.

En sistemas de almacenamiento NetApp, los fallos de disco automáticamente desencadenan reconstrucciones de paridad de los datos afectados en un disco de reserva (adicional) activo, suponiendo que haya un disco adicional disponible. Si no existen discos adicionales disponibles, no son posibles las operaciones de autorreparación. El sistema se ejecutará en modo reducido (las solicitudes de datos en el disco con error se satisfacen mediante la reconstrucción de los datos a través de la información de paridad) hasta que se suministra un disco adicional o se sustituye el disco con error. Durante este tiempo, los datos están en mayor peligro si se produce un fallo adicional. (Con NetApp RAID-DP™, un grupo RAID que opera en modo reducido puede sufrir un fallo de disco adicional sin sufrir pérdida de datos.)

El número de unidades de disco adicionales que necesita varía en función del número de unidades de disco adjuntas al sistema de almacenamiento. Para FAS200 o FAS2000 de nivel bajo con un sólo estante, un disco adicional puede ser suficiente (configure dos si desea hacer uso del Centro de mantenimiento). Para FAS6080, con un recuento de spindles máximo de 1.176 discos, se necesitan más discos adicionales para garantizar la máxima resistencia de almacenamiento, sobre todo con discos SATA más grandes que requieren tiempos de reconstrucción superiores.

NetApp recomienda utilizar dos unidades adicionales por tipo de disco para un máximo de 100 unidades de disco, donde el tipo de disco se determina por un tipo de interfaz único (FC, SATA o SAS), capacidad y velocidad rotacional. Por ejemplo, si tiene un sistema con 28 discos FC 15K de 300 GB y 28 discos FC 15K de 144 GB, debe tener cuatro unidades de disco adicionales: dos de 300 GB de capacidad y dos de 144 GB de capacidad.

Para cada 84 discos adicionales, se debe asignar otro disco de reserva al conjunto adicional. En la siguiente tabla se incluyen algunos ejemplos para ilustrar este enfoque. (En la tabla se supone que todos los discos son de un solo tipo.)

Número de estantes Número de discos Unidades adicionales recomendadas
6 84 2
8 112 3
12 168 3
24 336 4
36 504 6
72 1,008 12
2 28 2
Tabla 1) Selección del número adecuado de unidades adicionales para cada número dado de discos del mismo tipo.

Tenga en cuenta que si utiliza el Centro de mantenimiento de NetApp necesitará un mínimo de dos unidades adicionales de cada tipo en el sistema. El Centro de mantenimiento realiza un seguimiento de reparación proactivo de las unidades de disco y, cuando se alcanzan determinados umbrales de evento, intenta un mantenimiento preventivo en la unidad de disco sospechosa. Se requieren dos discos adicionales para que una unidad de disco sospechosa pueda ir al Centro de mantenimiento para un diagnóstico.

Consejo 3: Utilice SyncMirror para obtener la mayor resistencia posible.

Si necesita mayores niveles de resistencia aún de los que HA y RAID-DP ofrecen, utilice SyncMirror en una configuración local o en MetroCluster.

Local SyncMirror ofrece mirroring sincrónico entre dos agregados o volúmenes tradicionales diferentes en el mismo controlador de almacenamiento para garantizar que existe una copia de datos duplicada. Esta función está disponible a partir de la versión Data ONTAP® 6.2. El mirroring suministrado por SyncMirror se sitúa en el nivel máximo de protección RAID (RAID 4, RAID-DP o RAID 0 en Serie V).

SyncMirror segmenta los datos en dos grupos de almacenamiento duplicados que se llaman plexos, lo que puede resultar en mejoras de rendimiento de lectura en cargas de trabajo limitadas al disco. Ofrece mayor protección frente a múltiples fallos simultáneos en los duplicados. SyncMirror con RAID-DP tiene tanta tolerancia a errores que puede asegurar la disponibilidad de los datos con hasta cinco fallos simultáneos en los grupos RAID duplicados. SyncMirror utiliza la tecnología NetApp Snapshot™ para mantener controles sincronizados y, por tanto, la resincronización tras la pérdida de conectividad con un plexo lleva mucho menos tiempo. Sólo los datos que han cambiado desde el último control Snapshot se tienen que sincronizar.

SyncMirror también ofrece tolerancia ante desastres geográficos cuando se usa junto con MetroCluster. SyncMirror es necesario como parte de MetroCluster para garantizar que existe una copia idéntica de los datos en el centro de datos remoto en caso de que el centro de datos original deje de estar disponible. Cuando se emplea en configuraciones “active-active”, SyncMirror ofrece los mayores niveles de resistencia, lo que garantiza la continua disponibilidad de los datos.

Consejo 4: Defina las configuraciones de HA para actualizaciones sin interrupciones.

Definir los sistemas de almacenamiento en una configuración de HA con controladores de almacenamiento “active-active” es una buena forma de eliminar puntos de error únicos y de aumentar la resistencia. Además de eliminar el posible tiempo de parada no planificado, estas configuraciones pueden reducir el tiempo de parada planificado a través de actualizaciones sin interrupciones.

Las actualizaciones sin interrupciones (NDU) ofrecen la capacidad de actualizar de forma transparente cualquier componente de un sistema de almacenamiento “active-active” (software, firmware de disco y estante, componentes de hardware, etc.) con una interrupción mínima al acceso de datos del cliente mediante una actualización progresiva. Para realizar una actualización sin interrupciones, los dos controladores de almacenamiento deben ser idénticos desde el principio en cuanto a diversos factores, entre los que se incluyen licencias, acceso a la red y protocolos configurados. Puede conocer más datos sobre las NDU en un informe técnico reciente.

La mejor forma de garantizar que una actualización se realiza sin problemas es comprobar los sistemas con antelación para asegurarse de que satisfacen los requisitos de una NDU. Con el cumplimiento de estos requisitos, se asegurará además de que los sistemas HA están configurados de forma óptima para proporcionar la mayor resistencia y disponibilidad de datos posibles. NetApp ofrece un conjunto de herramientas automatizadas para que esto sea posible, según se describe en la sección siguiente.

Consejo 5: Compruebe la configuración del sistema de almacenamiento con herramientas automatizadas.

Si tiene sistemas de almacenamiento HA en clústeres o configuraciones de un solo controlador, es importante que se asegure de que tiene el hardware, firmware y software adecuados, sobre todo antes de realizar una actualización. Puede que tenga docenas de estantes de discos y cientos o incluso miles de discos; por tanto, no es tarea fácil.

Afortunadamente, NetApp Global Services (NGS) ha desarrollado un conjunto de herramientas diseñadas para automatizar los procesos que, de otro modo, supondrían una tarea tediosa y propensa a errores. La ejecución de estas herramientas periódicamente puede aumentar la resistencia de los sistemas de almacenamiento y simplificar las operaciones.

Cluster Configuration Checker

Esta herramienta detecta e identifica las causas de configuración más comunes de problemas de fallos:

  • Licencias incoherentes
  • Configuraciones de opciones incoherentes
  • Interfaces de red configuradas de forma incorrecta
  • Versiones diferentes de Data ONTAP en los nodos local y asociado
  • Diferencias en las definiciones de configuración de cfmode entre los dos nodos

Cluster Configuration Checker también está disponible como parte de NetApp Operations Manager.

Upgrade Advisor

Upgrade Advisor se ha diseñado como una solución integrada para dotar a un sistema de almacenamiento de una actualización Data ONTAP. La herramienta utiliza datos AutoSupport en directo para automatizar en primer lugar el proceso manual normalmente tedioso de documentar cada advertencia y requisito asociados con determinar la elegibilidad de un sistema y, a continuación, generar un plan de actualización detallado para usar en actualizar, así como en revertir una actualización.

La versión pública de Upgrade Advisor está disponible para los clientes a través de la interfaz Premium AutoSupport, que se incluye con la compra de SupportEdge Premium. Otros clientes pueden trabajar con NGS o NetApp Professional Services para dotar a los entornos de forma indirecta con Upgrade Advisor.

Upgrade Advisor
Figura 2) Upgrade Advisor.

Conclusión

No dé por sentado la resistencia de los sistemas de almacenamiento y no espere a que sea demasiado tarde. Si lleva a cabo unos cuantos pasos proactivos según se describe en este artículo, puede mejorar la resistencia de un sistema de almacenamiento. HA de múltiples rutas elimina puntos de error únicos en sistemas de almacenamiento de segundo plano y le ayuda a mejorar la consistencia del rendimiento. La configuración del número adecuado de discos adicionales garantiza que las reconstrucciones de disco se iniciarán de forma inmediata si un disco falla, lo que limita el riesgo. SyncMirror ofrece la mayor resistencia posible para operaciones de datos críticas. NDU reduce o elimina el tiempo de parada planificado para actualizaciones y ampliaciones, y una comprobación regular del sistema con herramientas automatizadas puede garantizar que las configuraciones son correctas al tiempo que simplifica la planificación de actualizaciones.

Steve Lawler and Haripriya Steve Lawler
Ingeniero de productos y socio
NetApp

Steve se centra exclusivamente en configuraciones de almacenamiento de alta disponibilidad. Con más de 15 años de experiencia en el sector, anteriormente trabajó en telecomunicaciones, donde obtuvo una amplia experiencia en la asistencia técnica a clientes a nivel de empresa.

Haripriya
Ingeniero de productos y socio
NetApp

Haripriya está especializada en la resistencia de los sistemas de almacenamiento, incluidos unidades de disco y estantes. Anteriormente trabajó en Hewlett-Packard, donde se centró en problemas de almacenamiento y RAID. Haripriya tiene un máster en informática y, en la actualidad, está preparando un máster en administración de empresas.

Comente sobre este artículo
Explore