NetApp: Tech OnTap Logotipo de NetApp
NetApp: Tech OnTap
     
Operaciones no disruptivas con Clustered Data ONTAP
Charlotte Brooks
Ingeniera de Marketing Técnico

El paso a la infraestructura compartida ha hecho que sea prácticamente imposible planificar tiempos de inactividad para realizar el mantenimiento rutinario. Un único sistema de almacenamiento puede estar virtualizado entre muchas aplicaciones, múltiples partes interesadas o muchos conjuntos de usuarios, por lo que negociar un plazo para el tiempo de inactividad, si existe la posibilidad, requiere una gran cantidad de tiempo y nadie queda contento. Además, el proceso de actualizar y sustituir equipamiento cuando termina su vida útil, incluso si puede hacerlo con una disrupción mínima, requiere tiempo, y la planificación es compleja.

Clustered Data ONTAP® de NetApp® ha sido diseñado para eliminar los tiempos de inactividad previstos para las operaciones de mantenimiento y del ciclo de vida útil, así como los tiempos de inactividad imprevistos causados por fallos del hardware y software. El objetivo de NetApp es lograr que su infraestructura de almacenamiento esté completamente disponible y sea flexible en todo momento sin tiempos de inactividad. Creemos que los datos deberían ofrecerse con la misma fiabilidad que cualquier otro servicio, del mismo modo que cuando abre el grifo, espera que salga agua.

Las operaciones no disruptivas de NetApp protegen su infraestructura contra los tiempos de inactividad previstos e imprevistos a la vez que simplifican en gran medida las operaciones de mantenimiento y del ciclo de vida útil.

Figura 1) Las operaciones no disruptivas de NetApp protegen su infraestructura contra los tiempos de inactividad previstos e imprevistos a la vez que simplifican en gran medida las operaciones de mantenimiento y del ciclo de vida útil.

Nuestras funciones de movilidad de datos y de red hacen posible cumplir con las tareas de mantenimiento y del ciclo de vida sin tiempos de inactividad. Las ventajas que obtiene de las operaciones no disruptivas son significativas, y muchas de ellas afectan a aspectos fundamentales:

  • Poner en funcionamiento nuevo hardware y/o actualizar el software de forma más rápida. ¿Alguna vez ha tenido hardware nuevo tirado en un pasillo o guardado en el almacén durante meses a la espera de tener un tiempo de inactividad para la actualización? Esto supone un retorno de la inversión deficiente. Con las operaciones no disruptivas, la espera será cosa del pasado.
  • Mayor aprovechamiento. Como puede añadir capacidad nueva cuando la necesite sin necesidad de esperar un tiempo de inactividad, puede llevar su clúster de NetApp a un mayor nivel de aprovechamiento. Ya no tendrá que mantener una gran red de seguridad en forma de capacidad de almacenamiento a la espera de ser utilizada.
  • Operaciones más sencillas. El tiempo de inactividad previsto a menudo requiere emplear un tiempo significativo ejecutando aplicaciones sin conexión. A continuación, tiene que reiniciar las aplicaciones y verificar que todo sigue funcionando correctamente una vez finalizado el mantenimiento. Las operaciones no disruptivas le permiten centrarse en realizar tareas de almacenamiento sin esta complicación. Las herramientas de NetApp para las operaciones no disruptivas son fáciles de utilizar y están diseñadas para una ejecución repetida y sin estrés según sea necesario.

En este artículo, profundizaré en las herramientas que ofrece NetApp para las operaciones no disruptivas y mostraré cómo pueden utilizarse estas funciones para cumplir tareas de mantenimiento y del ciclo de vida importantes.

Herramientas del sector

Clustered Data ONTAP permite operaciones no disruptivas al ofrecer flexibilidad ante los fallos y al permitirle cambiar su infraestructura de almacenamiento sin interrupciones para facilitar las operaciones diarias y el mantenimiento. Esto es posible porque, en lugar de acceder directamente a los recursos físicos, en Clustered Data ONTAP todos los accesos a datos pasan a través de una construcción lógica llamada equipo virtual de almacenamiento (SVM). Como resultado, los recursos físicos utilizados por un SVM pueden cambiar sin necesidad de cambios o interrupciones por parte del cliente o del host.

Los equipos virtuales de almacenamiento (SVM) de Clustered Data ONTAP abstraen el acceso a los datos del hardware físico para una mayor flexibilidad.

Figura 2) Los equipos virtuales de almacenamiento (SVM) de Clustered Data ONTAP abstraen el acceso a los datos del hardware físico para una mayor flexibilidad.

Es posible gracias a tres herramientas estándar:

  • DataMotion™ para volúmenes (movimiento de volúmenes). Le permite mover volúmenes de datos de un agregado a otro, en un mismo nodo de clúster o a uno distinto.
  • Migración de LIF. Las interfaces lógicas (LIF) virtualizan las interfaces físicas en Clustered Data ONTAP. La migración LIF le permite mover LIF de un puerto de red a otro, en el mismo nodo de clúster o a uno distinto.
  • Reubicación del agregado (ARL). Le permite transferir agregados completos de una controladora en un par de alta disponibilidad a otra sin mover datos.

Estas herramientas, utilizadas individualmente o en combinación, le proporcionan la capacidad de realizar una amplia gama de operaciones de forma no disruptiva, desde mover volúmenes de un disco más rápido a uno más lento, hasta actualizaciones tecnológicas completas del almacenamiento y de controladoras.

Data Motion para volúmenes

Data Motion para volúmenes (a menudo llamado movimiento de volúmenes) le permite mover un volumen dentro de un SVM de un agregado (el origen) a otro agregado (el destino). El destino puede estar en el mismo nodo o en cualquier otro nodo en el clúster. Independientemente de la ubicación a la que se muevan los datos y del protocolo de datos que se utilice (SAN o NAS), el acceso a los datos se conserva de forma transparente antes, durante y después de mover las aplicaciones del host/cliente.

Existen cuatro fases en el proceso de movimiento de volúmenes. Una vez que se ha iniciado el movimiento de un volumen, la progresión de las fases es automática, pero es importante comprender cada fase y las actividades subyacentes.

  • Fase de validación. Verifica que el movimiento de volumen solicitado es posible mediante la comprobación de la capacidad disponible en el agregado de destino y del cumplimiento de otros requisitos.
  • Fase de configuración. Se crea un nuevo volumen en el agregado de destino.
  • Fase iterativa. Los datos se replican desde el volumen de origen al volumen de destino mediante la replicación de grupos de copias Snapshot™ a través de la red de clúster. Tras cada iteración, se comprueba el delta entre el origen y el destino para ver si es lo suficientemente pequeño como para que se complete la replicación final en el tiempo definido en la fase de transposición. Los I/O de clientes y hosts al volumen origen no se ven afectados durante esta fase.
  • Fase de transposición. Todos los accesos de I/O se ponen en cola, y se bloquean las solicitudes al volumen de origen. La transferencia de replicación final termina y la base de datos del volumen se actualiza con la nueva información del volumen. Los I/O en cola se reanudan en el volumen de la nueva ubicación. La transposición se completa en un «plazo de transposición» definido que se encuentra dentro de un plazo aceptable para la aplicación del cliente/host.

Si la transposición no puede finalizarse dentro del plazo de transposición especificado, la fase de transposición se aborta y se reanuda el acceso a los datos del volumen fuente. Se reanudará cualquier solicitud pendiente que estuviera en cola durante el intento de transposición y se reanudará la fase de iteración hasta que se den las condiciones adecuadas para volver a intentar una transposición.

El plazo de transposición puede definirse entre 30 y 300 segundos; el valor predeterminado son 45 segundos. Como esta es la parte más crítica del proceso, el movimiento de volúmenes le proporciona cierto control sobre la fase de transposición. Por ejemplo, puede realizar la operación de forma que la transposición no se lleve a cabo hasta que no la accione. Esto le proporciona la opción de completar la transposición en el momento que elija.

Migración de LIF

La función Migración de LIF le proporciona la misma capacidad para mover conexiones de red que la que le proporciona el movimiento de volúmenes para volúmenes de datos. Un LIF es una interfaz de red lógica que virtualiza sus conexiones de red SAN y NAS. Los LIF están ligados a un SVM y se asignan a puertos de red físicos, grupos de interfaces o VLAN (cuando se utiliza el etiquetado) en la controladora. Como los LIF están virtualizados, una dirección LIF se mantiene igual aunque se migre un LIF a otro puerto físico en un mismo nodo o a otro nodo distinto dentro del clúster. Los LIF NAS fallan automáticamente si cae uno de los nodos del clúster, funcionando en conjunto con el fallo del almacenamiento en el par de alta disponibilidad para mantener el acceso a los datos. También puede migrar manualmente un LIF a otro puerto.

Cada nodo de clúster es compatible con un máximo de 262 LIF, 6 de los cuales están reservados para la gestión y para funciones del clúster. Los LIF de datos se utilizan para ofrecer datos a los clientes y hosts y se designan como SAN o NAS. Los LIF basados en IP (NAS o iSCSI) están asignados a direcciones IP y los LIF basados en FC están asignados a WWPN. Cada SVM requiere al menos un LIF de datos. En un funcionamiento normal, debería limitar el número de LIF de datos por nodo a 128 o menos. De esta forma, si se da un fallo de alta disponibilidad, el límite en el nodo del partner no se superará incluso aunque asuma el control de todos los LIF del nodo que ha fallado.

Además de los LIF de datos, existen los LIF de gestión para acceder al clúster a través del CLI u OnCommand® System Manager, y los LIF dentro del clúster para la red de interconexión de clúster.

La migración de LIF le permite mover un LIF basado en IP de un puerto físico o grupo de interfaz a otro. Los LIF de datos SAN (incluidos los iSCSI) no necesitan migrarse y no fallan. En lugar de eso, se utilizan los procesos ALUA y MPIO en los hosts con iniciadores para optimizar las rutas y tratar los fallos de ruta.

Puede utilizar la migración de LIF para mover todos los LIF de datos (y con ello todo el tráfico de red) fuera de un nodo en particular para realizar el mantenimiento o la sustitución de hardware. Otro ejemplo de uso de la migración de LIF es la capacidad para actualizar de forma no disruptiva desde un clúster sin switch de 2 nodos de gama básica (novedad en Clustered Data ONTAP 8.2) a un clúster con switch de 2 nodos. La migración de LIF permite mover los LIF de interconexión del clúster de modo que pueda introducir el switch sin interrumpir el flujo de datos. Una vez que el switch está en su sitio, puede ampliar el clúster según sea necesario para crear configuraciones de mayor tamaño.

Puede utilizar la migración de LIF para mover un LIF a un puerto distinto en el mismo nodo. Por ejemplo, puede tener un LIF configurado en un puerto GbE. Si ese LIF requiere más ancho de banda, puede moverlo temporalmente o de forma permanente a un puerto 10 GbE del mismo nodo.

Si quiere más información acerca de los LIF y otros temas de red de Clustered Data ONTAP, consulte TR-4182: mejores prácticas para las configuraciones de red de Clustered Data ONTAP.

Reubicación del agregado

La reubicación del agregado (ARL) es una nueva función que se introdujo en Clustered Data ONTAP 8.2. Debido a que en Clustered Data ONTAP todos los nodos de clústeres forman parte de un par de alta disponibilidad (a excepción de los clústeres de un solo nodo), la ARL hace posible la transferencia temporal de la propiedad de una controladora de un par de alta disponibilidad a otra para facilitar el proceso de actualización sin necesidad de mover datos.

Mediante ARL, usted puede realizar actualizaciones de controladoras en un tiempo considerablemente menor del necesario para migrar datos a otras controladoras, actualizar las controladoras existentes y migrar de nuevo los datos a su ubicación original. Un artículo reciente de Tech OnTap® de Julian Cates, ¿Qué novedades hay en Clustered Data ONTAP 8.2? aborda la ARL en profundidad y describe cómo funciona y las mejores prácticas para utilizarla.

Realización de tareas de mantenimiento y del ciclo de vida

Ahora que comprende las herramientas básicas, veamos cómo pueden utilizarse para llevar a cabo tanto las tareas de mantenimiento como del ciclo de vida. La Tabla 1 resume muchas de estas tareas y describe las ventajas de realizarlas de forma no disruptiva.

Tabla 1) Ejemplos de operaciones no disruptivas de mantenimiento y del ciclo de vida.

Operación del ciclo de vidaVentaja
  • Reequilibrar el rendimiento de la controladora, la capacidad y/o el rendimiento del disco y el aprovechamiento
  • Reducir el gasto de capital (inversión inicial)
  • Mejorar la gestión del ciclo de vida
  • Eliminar puntos conflictivos (un mejor rendimiento, menos riesgos de tiempos de inactividad no previstos)
  • Añadir controladoras de almacenamiento o bandejas de discos
  • Añadir hardware a las controladoras
  • Mejorar el rendimiento y la densidad
  • Mejorar la resiliencia
  • Actualizar las controladoras de almacenamiento, bandejas de discos y switches de clúster
  • Evitar las actualizaciones disruptivas de tecnología
Operaciones de mantenimiento 
  • Actualizar el software de almacenamiento
  • Aprovechar antes las nuevas características
  • Actualizar el sistema, disco, switch o firmware
  • Eliminar posibles riesgos
  • Sustituir un controlador fallido o un componente dentro de una controladora, como NIC, HBA y componentes del almacenamiento fallidos como cables, unidades o módulos I/O
  • Reducir la sobrecarga administrativa

Realizar tareas de mantenimiento

Muchos de los datos almacenados sobrevivirán al sistema de almacenamiento en el que se almacenan. Con el tiempo, el software deberá actualizarse y el hardware deberá ser sustituido o reparado.

Actualización de software y firmware

La actualización no disruptiva (NDU) incluye la actualización tanto del software como del firmware del sistema de almacenamiento. NDU es una solución exhaustiva para la actualización:

  • Software del sistema operativo (Data ONTAP)
  • Firmware del sistema operativo (BIOS)
  • Firmware de bandeja
  • Firmware de discos
  • Ruta de control alternativa (ACP) de firmware

Estas tareas se realizan todas de manera que las interrupciones de I/O son breves. Las aplicaciones siguen operando sin la necesidad de notificar al usuario ni de programar tiempos de inactividad complicados. La toma de control y la devolución del almacenamiento (con ARL en segundo plano) junto con la migración de LIF le permite realizar operaciones de mantenimiento en una controladora en un par de alta disponibilidad cada vez, sin interrumpir los servicios de datos. Puede utilizar la herramienta Asesor de actualizaciones (requiere acceso al sitio de soporte de NetApp) en My AutoSupport™ para ayudarle a planificar actualizaciones no disruptivas. La herramienta genera una lista completa con los pasos necesarios para llevar a cabo una actualización en todo su clúster.

Antes de Clustered Data ONTAP 8.2, las actualizaciones del sistema operativo tenían que realizarse con el proceso de «implantación de actualización», el cual actualizaba un par de alta disponibilidad cada vez. En clústeres de mayor tamaño, era un proceso que requería mucho tiempo. Desde Clustered Data ONTAP 8.2, también tiene la opción de realizar una actualización por lotes en clústeres con 8 nodos o más. Esto acelera el tiempo necesario para llevar a cabo una actualización en clústeres de gran tamaño. La actualización por lotes le permite realizar operaciones de actualización en diversos nodos en paralelo, lo cual reduce el tiempo total necesario para actualizar el clúster al completo. Se permite que un clúster ejecute dos versiones distintas de Clustered Data ONTAP mientras se está realizando la actualización, pero la mejor práctica es mantener al mínimo el tiempo en el que el clúster utiliza un modo mixto. Esto es posible gracias a la actualización por lotes.

Reparación y sustitución de hardware

Las operaciones no disruptivas respaldan la reparación o sustitución de componentes de hardware en el subsistema de almacenamiento, desde unidades de discos y cables a controladoras y bandejas. Las unidades de disco están protegidas por RAID y pueden repararse o sustituirse siguiendo procedimientos estándar que normalmente no requieren el uso de las herramientas descritas anteriormente. Muchos componentes redundantes como cables también pueden sustituirse tras un fallo sin utilizar estas herramientas.

Completar operaciones del ciclo de vida

Las operaciones del ciclo de vida incluyen actividades para equilibrar y optimizar la capacidad y/o el rendimiento, así como operaciones para ampliar o actualizar la tecnología de su clúster. Una infraestructura de Clustered Data ONTAP es flexible y adaptable a los muchos cambios necesarios que se dan a lo largo de los años de un funcionamiento constante.

No importa lo buena que sea su capacidad de planificación: es inevitable que surjan situaciones en las que algunos agregados se quedan cortos de capacidad mientras que otros tienen espacio extra disponible. Corregir este tipo de desequilibrios de capacidad es fácil con el movimiento de volúmenes para transferir volúmenes de agregados llenos a los que tienen espacio libre.

Los desequilibrios en el rendimiento pueden tratarse de forma similar. Los volúmenes que requieren un mayor rendimiento pueden moverse a una controladora más capaz (en un clúster mixto), a una controladora con una carga menor o a un medio más rápido. Por ejemplo, puede mover un volumen que requiera un mayor rendimiento de un agregado con discos de alta capacidad a uno compuesto por discos de rendimiento, o puede moverlo a una controladora que contenga Flash Cache™ o un agregado de Flash Pool™ que combine SSD y HDD. A la inversa, si los requisitos de rendimiento de un conjunto de datos disminuyen, puede mover el volumen o volúmenes asociados a un agregado compuesto por discos de alta capacidad.

Para los administradores de clúster de Clustered Data ONTAP, el movimiento de volúmenes es un evento estándar de bajo nivel de estrés que normalmente no requiere ninguna solicitud de cambio. El movimiento de volúmenes permite que su equipo del departamento de TI logre sus objetivos de capacidad y rendimiento y optimice las operaciones sin saltarse el presupuesto, ya que pueden mover datos fácilmente al tipo de almacenamiento adecuado para los requisitos de la aplicación en lugar de tener que aprovisionar y poner en funcionamiento todo en unidades más caras y de mayor rendimiento.

Actualización técnica

La «guinda del pastel» de las operaciones no disruptivas de NetApp es la capacidad de realizar una actualización tecnológica completa sin disrupciones. El proceso de sustituir hardware de almacenamiento siempre ha sido disruptivo, requería tiempo y era caro. De hecho, un estudio reciente sugiere que para migrar datos de una cabina de almacenamiento antigua a una nueva se requieren 5 meses de media, y supone un 50 % más de coste de propiedad de la cabina.

Clustered Data ONTAP le permite realizar actualizaciones completas de hardware de forma sencilla sin tener que poner los datos offline, por lo que se evitan estos costes ocultos. No es necesario que los sistemas de almacenamiento en clúster sean de la misma generación o modelo, por lo que puede sustituir una plataforma FAS por otra, o incluso cambiar toda la infraestructura de almacenamiento, sin interrumpir las aplicaciones que se están ejecutando ni a los ocupados usuarios. Ningún otro almacenamiento puede hacer lo mismo.

Puede utilizar ARL para actualizar de forma rápida y cómoda las controladoras de almacenamiento existentes o puede realizar actualizaciones completas, incluyendo unidades y bandejas, con movimiento de volúmenes. En este último caso, normalmente añade el sistema nuevo al clúster y mueve los datos del sistema antiguo al nuevo antes de retirar el sistema antiguo.

Esto no es simplemente teóricamente posible, si no que se han realizado actualizaciones tecnológicas completas en diversas ocasiones. Por ejemplo, un usuario que llevaba mucho tiempo utilizando Clustered Data ONTAP realizó la transición de forma no disruptiva de un clúster de más de 20 FAS6080 a 16 FAS6280, cada uno con 512 GB de almacenamiento en Flash Cache. La capacidad total antes y después de la actualización se mantuvo cerca de 1 petabyte.

La transición se logró trabajando en conjuntos de cuatro. El equipo del departamento de TI añadió cuatro nodos nuevos y movió los volúmenes de cuatro de los nodos antiguos a los nuevos. A continuación, desconectaron los nodos antiguos y movieron cualquier bandeja de discos a la que respaldaran (algunos de estos componentes de hardware eran bastante antiguos y tuvieron que retirarse) al siguiente conjunto de nodos nuevos.

Los usuarios experimentaron un aumento notable en el rendimiento, y la actualización también redujo los costes de mantenimiento actuales. Y, lo que es más importante, todo el proceso se llevó a cabo sin tiempos de inactividad. Tenga en cuenta que la disponibilidad de ARL lograría que este tipo de actualización fuera todavía más sencilla y rápida que en el momento de realizar la actualización. Algunos de los primeros en adoptar este sistema ya han utilizado ARL para actualizar clústeres al completo en eventos de un día, sin necesidad de migrar datos ni de tiempos de inactividad.

Conclusión

Clustered Data ONTAP lleva las operaciones no disruptivas a otro nivel. Unas pocas herramientas sencillas (movimiento de volúmenes, migración de LIF y reubicación de agregados) logran que sea posible cumplir con las tareas de mantenimiento y del ciclo de vida de forma rápida y sencilla, las cuales era imposible realizar sin tiempos de inactividad previstos e interrupciones significativas. La capacidad de realizar tareas según sea necesario en lugar de tener que esperar a plazos de inactividad poco frecuentes supone que su entorno de almacenamiento está optimizado y que los riesgos se reducen en gran medida.

 ¿Quiere expresar su opinión acerca de las operaciones no disruptivas?

Formule preguntas, intercambie ideas y comparta sus opiniones en las comunidades en línea de NetApp.

Charlote Brooks, Ingeniera Técnica de Marketing

Charlotte es una Ingeniera Técnica de Marketing de Clustered Data ONTAP. En más de 5 años en NetApp, ha escrito y presentado en numerosas ocasiones acerca de Clustered Data ONTAP y temas de gestión del almacenamiento. Su principal interés son las operaciones no disruptivas y las actualizaciones no disruptivas.

Tech OnTap
Suscríbase ahora
Tech OnTap ofrece reportajes mensuales, acceso exclusivo a mejores prácticas, sugerencias y herramientas reales, entrevistas técnicas exclusivas, demostraciones, evaluaciones de expertos y mucho más.

Visite Tech OnTap en la comunidad de NetApp y suscríbase hoy mismo.

En profundidad
En profundidad
Obtenga más información acerca de Clustered Data ONTAP 8.2 y las operaciones no disruptivas

En caso de que se lo haya perdido, el mes pasado Julian Cates, Ingeniero Técnico de Marketing, escribió una reseña de las nuevas funciones de 8.2 y habló en profundidad de la reubicación de agregado, la calidad de servicio y las mejoras de Microsoft® Windows®. Lea su artículo, además de un nuevo documento técnico que explora las ventajas empresariales de las operaciones no disruptivas, la eficiencia y la escalabilidad.

En profundidad
 
TRUSTe
Póngase en contacto con nosotros   |   Cómo comprar   |   Comentarios   |   Empleo  |   Suscripciones   |   Política de privacidad   |    © 2013 NetApp