Construir una infraestructura que se ajuste a un objetivo de punto de recuperación (RPO) de cero y al objetivo de tiempo de recuperación (RTO) más bajo posible no es fácil. Uno de los motivos es que un centro de datos completo o una zona de disponibilidad (AZ) pueden fallar. La solución es que tu infraestructura abarque varias zonas de disponibilidad, y eso puede suponer un reto.
Existen métodos para lograr este nivel de disponibilidad, pero desarrollarlo por tu cuenta requiere tiempo y una gestión cuidadosa, y este enfoque puede causar problemas de rendimiento y latencia.
En esta publicación, analizamos cómo Amazon FSx para NetApp ONTAP ofrece una mejor solución: una opción integrada para la implementación multi-AZ que proporciona alta disponibilidad en AWS.
Utiliza estos enlaces para ir a cada sección:
La alta disponibilidad multi-AZ no es fácil
Las implementaciones empresariales requieren sistemas que puedan gestionar fallos, desde componentes individuales hasta zonas de disponibilidad completas, sin perder datos (RPO=0). Estos sistemas también deben recuperarse rápidamente de las interrupciones para mantener un RTO mínimo, lo que requiere resiliencia en hardware, redes y ubicaciones geográficas.
Existen métodos para lograr este tipo de alta disponibilidad multi-AZ en AWS. Sin embargo, para construir este tipo de infraestructura, es necesario diseñar los mecanismos para la sincronización de datos en tiempo real, la seguridad de datos sin interrupciones y la recuperación en todas las zonas de disponibilidad. Todas estas operaciones se vuelven más complejas al agregar otra zona.
Las tareas subyacentes son complejas:
- Redundancia mediante replicación sincronizada. Para lograr una redundancia absoluta, los datos deben replicarse sincrónicamente entre zonas, un proceso que generalmente gestiona una capa de orquestación inteligente. La configuración debe garantizar que la replicación sea precisa y oportuna, eliminando el riesgo de pérdida de datos para lograr consistentemente un RPO de 0.
- Abordar la latencia en el acceso a los datos. La sincronización de datos en tiempo real entre zonas dificulta superar la latencia. Si bien el almacenamiento en caché y las redes de entrega de contenido (CDN) pueden compensar parcialmente esta latencia, el desafío principal radica en desarrollar una red de alto rendimiento con interconexiones dedicadas, capaz de reducir consistentemente la latencia para la comunicación entre zonas.
- Dinámica de conmutación por error. Lograr una transición fluida entre zonas presenta un desafío con matices, especialmente con el objetivo de un RTO mínimo. El marco de almacenamiento debe ser resiliente y capaz de replicar datos, sin discrepancias, entre entornos. También debe ser capaz de realizar conmutaciones por error y recuperación sin perder datos ni interrumpir la experiencia del usuario.
- Protección de datos sin punto de fallo.
Construir tu propia arquitectura multi-AZ introduce nuevos componentes en tu infraestructura, y cualquiera de ellos puede convertirse en un punto de fallo adicional. Para evitar la exposición o pérdida de datos, es importante contar con soluciones para Snapshots puntuales, copias de seguridad consistentes y procesos de recuperación de desastres (DR) sin interrupciones.
También necesitarás estándares de seguridad uniformes, como cifrado en tránsito y en reposo, controles de acceso, protección contra ransomware y bloqueos de datos de una sola escritura, lectura múltiple (WORM).
- Contención de costes y copias de datos. Con un sistema redundante que abarca múltiples AZ, se presentan dos preocupaciones principales en cuanto a costes: elevados costes generales y costes redundantes. No solo gastarás en recursos determinantes para construir y mantener un sistema multi-AZ, sino que, una vez configurado, se duplicarán todos los costes de ejecutar una sola implementación, desde los datos almacenados hasta el tráfico de red entre las AZ.
Teniendo en cuenta estos factores, la alta disponibilidad multi-AZ no es una solución sencilla para llevar a cabo por ti mismo. Pero en AWS, existe una opción más sencilla: alta disponibilidad multi-AZ integrada con FSx para ONTAP.
Cómo lograr alta disponibilidad multi-AZ con FSx para ONTAP
FSx para ONTAP es un servicio totalmente gestionado de AWS. Utilizando las características exclusivas de gestión de datos de NetApp® ONTAP®, ofrece opciones de almacenamiento compartido de alto rendimiento para archivos y almacenamiento en bloques. Una de estas características es la alta disponibilidad multi-AZ.
Los recursos de infraestructura para los nodos de FSx para ONTAP se aprovisionan en diferentes AZ dentro de la misma región de AWS, y los datos se replican sincrónicamente en ambos nodos. Las operaciones de escritura se completan solo después de que los datos se hayan agregado a ambos nodos; de esta manera, no se pierden datos si ocurre una interrupción.
Si ocurre una interrupción, incluso algo tan masivo como un fallo completo de una zona de disponibilidad, FSx para ONTAP conmuta automáticamente y sin problemas al nodo FSx para ONTAP en buen estado y sigue entregando datos continuamente.
Este nodo operativo puede continuar atendiendo todas las solicitudes de datos desde su propia copia independiente de los datos, lo que le permite mantener un RPO de 0. Cuando el nodo fallido se recupera, se actualiza automáticamente con los datos actualizados del nodo en buen estado y conmuta a la operación en modo dual.
Arquitectura de alta disponibilidad multi-AZ de FSx para ONTAP.
Si no necesitas un nivel de disponibilidad tan alto, puedes optar por una estructura de doble nodo que reside en una única zona de disponibilidad.
Beneficios de la implementación de alta disponibilidad multi-AZ con FSx para ONTAP
Al usar FSx para ONTAP para implementaciones multi-AZ, obtienes los siguientes beneficios:
- Alta disponibilidad: logra un RPO de 0 mediante la duplicación sincrónica de datos en múltiples zonas de disponibilidad en tiempo real, lo que evita la pérdida de datos incluso durante interrupciones. Esto contribuye a una disponibilidad del 99,99 %, crucial para aplicaciones críticas.
FSx para ONTAP almacena réplicas de tus datos en múltiples zonas de disponibilidad simultáneamente. Si una zona de disponibilidad falla, el sistema redirige automáticamente el acceso a los datos a la réplica en la otra AZ.
- Resiliencia de datos: gracias a los procesos automáticos y sin interrupciones de conmutación por error y recuperación, FSx para ONTAP puede ayudarte a alcanzar un RTO inferior a 60 segundos. La solución cambia automáticamente al nodo redundante (conmutación por error) y reanuda la operación de doble nodo (recuperación tras recuperación) cuando el nodo fallido se recupera.
- Seguridad robusta: además de implementar estrictos controles de acceso, FSx para ONTAP también cifra los datos en reposo y en tránsito. El servicio también protege los datos con copias NetApp Snapshot™ inmutables para evitar cambios no autorizados y ofrece protección contra malware para protegerse de las ciberamenazas.
- Protección integral de datos: las copias Snapshot locales permiten una rápida recuperación de datos, y las opciones optimizadas de backup y recuperación de desastres entre regiones mantienen los datos seguros en todos los ámbitos.
- Copias de datos con optimización de costes: FSx para ONTAP optimiza los costes mediante las funciones de eficiencia de almacenamiento de ONTAP. La deduplicación, compresión y compactación de datos reducen el uso y los costes de almacenamiento hasta en un 65 %, y la clasificación automática por niveles de los datos poco utilizados por capacidad reduce los costes de almacenamiento premium en SSD. Estas funciones no comprometen la disponibilidad de los datos en ningún sentido.
FSx para ONTAP ayuda a que tus operaciones resistan ante las interrupciones más graves. A continuación te contamos cómo una empresa está aprovechando esta situación.
Cómo una empresa de software mantiene la alta disponibilidad multi-AZ con FSx para ONTAP
Una empresa que utiliza FSx para ONTAP para mantener las operaciones funcionando sin problemas es un desarrollador de software de soluciones de involucración de los empleados. La tecnología de software como servicio (SaaS) de esta empresa global ofrece herramientas para la gestión eficiente de los empleados y una interacción con los clientes acorde a la normativa. Y esas herramientas requieren alta disponibilidad. La empresa necesitaba una solución de almacenamiento unificado que pudiera proporcionar escalabilidad, mantener la integridad de los datos en configuraciones multi-AZ y ayudarla a cumplir con los estrictos estándares de cumplimiento y seguridad.
La solución fue migrar a la nube y adoptar FSx para ONTAP, que ofrece ventajas como la alta disponibilidad multi-AZ y las funciones de recuperación de desastres entre regiones de FSx para ONTAP, mantienen protegidos los datos de la empresa.
- Operaciones simplificadas. Con la migración a FSx para ONTAP, la empresa eliminó la necesidad de una gestión directa de su infraestructura de almacenamiento. Ahora, cuenta con un único servicio de almacenamiento totalmente gestionado que gestiona tanto sus cargas de trabajo de Kubernetes nativas de la nube modernizadas como las aplicaciones SaaS migradas desde sus sistemas heredados.
- Rentabilidad. Gracias a sus funciones de eficiencia de almacenamiento, FSx para ONTAP ofreció un ahorro considerable, reduciendo el coste total de propiedad (TCO) del almacenamiento en la nube de la empresa.
Una forma más sencilla de mantener la continuidad del negocio
Debes asegurarte de que tus aplicaciones estén siempre disponibles y seguras. FSx para ONTAP puede ayudarte a lograrlo, incluso en las peores interrupciones.
Con la opción de implementación multi-AZ, FSx para ONTAP alcanza un RPO de 0 y un RTO de <60 segundos desde el primer momento. Esto significa que sus operaciones no se verán afectadas por interrupciones importantes y no tendrás que preocuparte por gastos adicionales.