Los patrimonios de datos en constante expansión y los equipos distribuidos que trabajan de forma remota han cambiado las demandas sobre los datos. Recuperar datos rápidamente y colaborar eficazmente en patrimonions de datos compartidos en diversos entornos es esencial, sin importar dónde se alojen los datos.
Ese tipo de distribución de datos puede ser una pesadilla de orquestar, con problemas de integridad de datos, incompatibilidad y rendimiento que causan dificultades. Las organizaciones necesitan formas de acelerar el acceso a los datos y promover la agilidad y la colaboración sin esos desafíos.
NetApp y AWS se han asociado para ofrecer la solución: almacenamiento en caché de datos con Amazon FSx para NetApp ONTAP. En esta entrada del blog exploramos las capacidades de almacenamiento en caché de datos de FSx para ONTAP que ayudan a abordar los desafíos de trabajar con datos dispersos globalmente.
Sigue leyendo para conocer todos los detalles o usa estos enlaces para saltar a la sección que te interese:
El complejo desafío de los datos distribuidos
Los datos distribuidos presentan varios desafíos que las organizaciones deben superar:
- Consolidación de los datos. Cuando los datos están distribuidos en distintas ubicaciones, es necesario consolidar los datos de varias fuentes. Si no puedes ver los datos de manera coherente como un único sistema de archivos, no podrás leerlos ni escribirlos de manera eficiente, ni analizarlos para obtener de ellos algún valor comercial significativo.
- Múltiples espacios de nombres. La ausencia de espacios de nombres coherentes en los datos de diferentes fuentes añade una capa adicional de complejidad. Para acceder y utilizar los datos de forma coherente, es necesario unificar las diferentes convenciones de nomenclatura y estructuras, pero este proceso puede requerir un esfuerzo importante.
- degradación del rendimiento. Poner los datos a disposición de todos los usuarios puede resultar difícil sin que el rendimiento se degrade en algún momento del proceso. Cuanto más lejos estén los usuarios del patrimonio de datos, mayor latencia experimentarán.
Necesitas un equilibrio delicado entre acceso de baja latencia, ancho de banda optimizado y coste. Crear silos de datos en diferentes entornos y geografías no es una solución; aunque brindará a los usuarios locales un acceso más rápido a los datos, causa problemas de sincronización.
- Replicación de datos. Los datos que se replican en múltiples entornos deben ser consistentes y estar actualizados. El mayor riesgo es que puedan surgir discrepancias durante la replicación, lo que abre la puerta a una falta de integridad de los datos.
- Aumentos de costes. La naturaleza distribuida de los sistemas de edge y de nube presenta algunos desafíos relacionados con los costes. Podrías terminar con diferentes copias completas de datos en diferentes ubicaciones (por las que tendrías que pagar). Es necesario pensar en gestionar el coste asociado a la transferencia de datos y a la gestión centralizada.
Navegar por las complejidades de trabajar con datos distribuidos puede ser extremadamente desafiante. Ahí es donde FSx para ONTAP te puede ayudar.
Almacenamiento en caché de datos con FSx para ONTAP
FSx para ONTAP es el servicio de almacenamiento totalmente gestionado de AWS que ofrece soluciones de gestión de datos NetApp® ONTAP® de total confianza.
FSx para ONTAP cuenta con funcionalidades de almacenamiento en caché de datos que permiten un acceso más rápido a los datos y una colaboración fluida y en tiempo real en múltiples entornos. FSx para ONTAP hace esto de dos modos: consolidando datos en el edge y almacenando en caché copias editables de datos localmente.
Consolidación de datos en el edge
FSx para ONTAP ayuda a consolidar los datos no estructurados para lograr una experiencia de alto rendimiento, eficiencia operativa y colaboración a escala mediante el uso de la tecnología de caché de archivos global (GFC) de NetApp. FSx para ONTAP almacena en caché únicamente los datos necesarios en las ubicaciones respectivas y utiliza el protocolo de bloque de mensajes del servidor (SMB)/sistema de archivos de Internet común (CIFS). Es transparente para el usuario, la colaboración a través de GFC es como trabajar con archivos locales.
GFC puede admitir arquitecturas de nube híbrida compuestas por ONTAP on-premises y sistemas FSx para ONTAP ofreciendo una solución de almacenamiento centralizada con una caché de datos distribuida en ubicaciones del edge. Tus usuarios en todo el mundo pueden acceder a este único conjunto de datos, con escalabilidad de petabytes.
Dado que los datos utilizados con frecuencia se almacenan en la caché, se obtiene un mejor rendimiento para las aplicaciones colaborativas. La función de bloqueo inteligente de archivos mantiene la integridad de los datos incluso si se accede a ellos desde múltiples ubicaciones utilizando un espacio de nombres global.
Arquitectura general del almacenamiento en caché de NetApp
Datos en caché totalmente modificables en ubicaciones remotas
FSx para ONTAP te permite crear una caché persistente y modificables en una ubicación remota con la copia más reciente, consistente y coherente de sus datos. Estos volúmenes en caché modificables y escasamente poblados se pueden usar para crear una caché en el mismo sistema o en uno diferente para un acceso más rápido a los datos. La tecnología de NetApp® FlexCache lo hace posible.
FlexCache en FSx para ONTAP
Se puede acceder a los datos almacenados en caché a través del sistema de archivos de red (NFS) y SMB/CIFS, lo que significa que puedes utilizar los datos almacenados en caché sin tener que rediseñar tus sistemas para nada. Estos datos son beneficiosos en entornos de lectura intensiva donde los datos son compartidos por múltiples hosts y se accede a ellos más de una vez.
Para optimizar el tamaño de la copia de datos en caché, solo se almacenan en caché los datos leídos por el cliente. Los clientes pueden montar cualquiera de los volúmenes para acceder a los mismos datos precargados y actualizados desde múltiples ubicaciones. El volumen en caché actúa como una ubicación de almacenamiento temporal entre un host y la fuente de datos, y almacena los fragmentos de datos a los que se accede con frecuencia para que se puedan servir más rápido que al obtenerlos de la fuente.
Las copias de caché apuntan a bloques de datos relevantes en los datos de origen para optimizar el tamaño de la copia.
Casos de uso para el almacenamiento en caché de datos con FSx para ONTAP
El almacenamiento en caché de datos con FSx para ONTAP puede ayudar en una amplia gama de escenarios:
- Ubicaciones de oficinas remotas o sucursales (ROBO)
- Cargas de trabajo de computación de alto rendimiento (HPC)
- Casos de uso de inteligencia artificial/aprendizaje automático (IA/ML) y aprendizaje profundo (DL)
- Ráfagas en la nube
Beneficios de usar FSx para ONTAP y el almacenamiento en caché de datos
Con FSx para ONTAP, dispones de una solución de bajo consumo para todos tus requisitos de almacenamiento en caché de datos:
- Acceso rápido a datos remotos. El almacenamiento en caché de datos hace que los datos remotos estén disponibles más cerca de los usuarios, con requisitos arquitectónicos adicionales mínimos o nulos.
- Alto rendimiento. El almacenamiento en caché de datos con FSx para ONTAP elimina los desafíos de latencia asociados con el acceso a datos de todo el mundo, sin comprometer la integridad ni la calidad de los datos.
- Bloqueo de archivos. El mecanismo de bloqueo de archivos de FSx para ONTAP evita operaciones de escritura paralelas que podrían causar problemas de integridad de datos.
- Configuración sin intervención. FSx para ONTAP mantiene consistentes los conjuntos de datos en todos los diferentes entornos, tanto en caché como en el origen, sin ningún esfuerzo.
- Protección de datos y resiliencia. FSx para ONTAP tiene alta disponibilidad y es resiliente de forma predeterminada, y utiliza una o varias zonas de disponibilidad para mantener el tiempo de actividad. Con sus funciones automatizadas de copia de seguridad interregional y recuperación ante desastres, los datos están disponibles incluso si se producen daños o desastres regionales.
- Espacio de nombres único. FSx para ONTAP resuelve el problema de espacio de nombres que ocurre cuando los datos se almacenan en varias ubicaciones. Se puede consolidar y acceder a los datos a través de un único espacio de nombres sin necesidad de ninguna consolidación de infraestructura.
- Costos de almacenamiento reducidos. El almacenamiento en caché de datos con FSx para ONTAP ahorra espacio porque solo almacena en caché datos activos, no copias completas. Además, las funciones de eficiencia de almacenamiento integradas de FSx para ONTAP funcionan con almacenamiento en caché de archivos inteligente. Esto reduce los costes de almacenamiento y transferencia.
caso de un fabricante que colabora en AWS con FSx para ONTAP
Una empresa europea centrada en la producción de equipos de placas de circuito impreso (PCB) utiliza las capacidades de almacenamiento en caché de datos de FSx para ONTAP. Opera en más de 40 países.
Pero con los datos en la nube dispersos por la Unión Europea, Estados Unidos y Asia-Pacífico, la empresa estaba experimentando problemas de latencia y productividad. Los equipos distribuidos en distintas ubicaciones ROBO no podían colaborar eficazmente con los mismos datos.
FSx para ONTAP con caché de archivos global resolvió los problemas de latencia en las ubicaciones ROBO y proporcionó otras ventajas:
- Acceso global a archivos. La integración con espacios de nombres del sistema de archivos distribuido (DFS-N) preserva los espacios de nombres y las listas de control de acceso (ACL). Esto significa que los empleados pueden acceder a los archivos almacenados en cualquiera de los sistemas de archivos FSx para ONTAP en los centros globales como si estuvieran almacenados localmente.
- Bloqueo de archivos. Esta función permite a los equipos de la empresa colaborar en archivos de proyectos compartidos sin realizar cambios conflictivos y mejora la productividad entre equipos ubicados en todo el mundo.
- La facilidad de un servicio totalmente gestionado. AWS se encarga de todos los recursos subyacentes, las actualizaciones de software y el mantenimiento, lo que le quita la carga operativa de encima. Asimismo, GFC es un complemento sencillo que no requiere ninguna capacitación especial por parte del usuario final.
- Ahorro de costes por varios factores:
- FSx para ONTAP aplica eficiencias de almacenamiento y niveles de datos fríos que reducen los costes generales de almacenamiento de archivos compartidos.
- Cada instancia de GFC almacena en caché solo los archivos a los que se accede con frecuencia en ese sitio del edge y, siempre que se modifica un archivo, solo se transfieren los bloques modificados. Este enfoque da como resultado costes mínimos de tráfico de datos y transferencia de salida.
- Los recursos compartidos de archivos de FSx para ONTAP están protegidos mediante la rentable tecnología de NetApp Snapshot™. No es necesario implementar soluciones de protección de datos adicionales en el edge.
Reúne tus datos y equipos con FSx para ONTAP
Tus equipos necesitan una forma de colaborar en todo tu patrimonio de datos sin sufrir demoras ni crear silos de datos que aumenten los costes y dañen la integridad de los datos. Para un patrimonio de datos diverso, la solución es FSx para ONTAP.
FSx para ONTAP utiliza funciones de almacenamiento en caché de datos impulsadas por las tecnologías NetApp FlexCache y GFC para brindar almacenamiento en caché de datos como una parte integrada de un servicio propio de AWS.
Crea arquitecturas de datos distribuidas y fiables, mantén a tus usuarios sincronizados y evita que los costes se disparen.
Para obtener más información, visita Almacenamiento en caché de datos mediante Amazon FSx para NetApp ONTAP.