NetApp Tech OnTap
     

¿Puede sacarle partido a la protección de datos integrada?

Una protección de datos completa exige mucho más que funciones de backup y restauración. Para proteger la accesibilidad de los datos comerciales esenciales, debe plantearse lo siguiente:

  • Gran disponibilidad
  • Recuperación tras siniestros
  • Continuidad del negocio
  • Archivado y cumplimiento de normativas

Lo más probable es que dependa de una gran gama de soluciones para realizar estas funciones. Puede que tenga un proveedor para la gran disponibilidad, otro para backup y restauración, un tercero para la continuidad del negocio y un cuarto para el archivado. Como resultado, se encuentra con una gran complejidad en la gestión y un gasto muy importante.

Una estrategia de protección de datos integrada reduce estas complejidades, porque coloca algunas funciones clave de la protección de datos en el almacenamiento, lo que le permite conseguir objetivos de punto de recuperación y objetivos de tiempo de recuperación más competitivos, a la vez que se reducen los costes y se minimizan los gastos de gestión.

En este artículo se explica qué es la protección de datos integrada y se compara el flujo del proceso con los métodos tradicionales de protección de datos en cuanto a la identificación de ficheros nuevos y modificados, así como del movimiento y el almacenamiento de datos. También se habla del valor de la protección de datos integrada para las aplicaciones esenciales.

¿Qué es la protección de datos integrada?

El método tradicional de protección de datos es caro y no logra sacar provecho a todas las ventajas de las funciones del sistema de almacenamiento. Las aplicaciones de protección de datos se encuentran encima del sistema operativo de su servidor y copian los datos a un almacenamiento secundario. Estas aplicaciones no utilizan funciones especiales de captura de datos y movimientos incorporadas en el almacenamiento subyacente, que originan operaciones lentas que restringen sus objetivos de tiempo y de puntos de recuperación, y que tienen un impacto potencial en otras actividades.

La protección de datos integrada presenta un enfoque más eficaz, a la vez que mantiene los datos en un formato que puede utilizarse para conseguir otros objetivos. Con la protección de datos integrada, las funciones de alta disponibilidad, backup y cumplimiento se incluyen en el sistema de almacenamiento. Todas las características funcionan a la vez, y puede utilizar el mismo conjunto de datos para varios propósitos y requisitos de protección de datos. Este método ofrece varias ventajas:

  • Las funciones de protección de datos clave proceden de un único proveedor, lo que simplifica la implementación y la gestión permanente, a la vez que aumenta la interoperabilidad.
  • A fin de ofrecer un mejor rendimiento y una mayor funcionalidad, se aprovechan todas las funciones de almacenamiento.
  • Las copias de los datos se pueden utilizar para realizar otras tareas para obtener un retorno de la inversión más rápido.

El seguimiento del flujo de protección de datos pone de relieve estas diferencias.

Comparación de los métodos de protección de datos

Casi todas las operaciones de protección de datos (backup, replicación o archivado) presentan un conjunto de actividades comunes:

  • Identificación de los datos nuevos o modificados
  • Traslado de datos
  • Almacenamiento de datos

Identificación de los datos nuevos o modificados
Antes de comenzar un traslado de datos con una operación de protección de datos tradicional (como un backup), lo primero es identificar todos los datos nuevos o modificados. En un proceso de backup tradicional, suele tratarse de un proceso de recopilación de ficheros que consume mucho tiempo y que implica un “desglose de sistemas de ficheros”. La marca de fecha de cada fichero debe compararse con la fecha del último backup a fin de identificar los ficheros que han cambiado y crear un catálogo de ficheros antes de que se produzca un movimiento real de datos. En sistemas de ficheros muy grandes, este proceso puede llevar bastantes minutos, incluso horas.

La protección de datos integrada alternativa se encarga de aprovechar la tecnología Snapshot dentro del sistema de almacenamiento. Snapshot no requiere un proceso tan largo, porque captura de forma inmediata un índice de punteros que señalan a los bloques de datos concretos (no a los ficheros completos) que han cambiado desde el Snapshot anterior, lo que permite que el movimiento de datos comience más rápidamente.

Traslado de datos
La capacidad de trasladar los datos está estrechamente relacionada con la capacidad para identificarlos. Las tecnologías tradicionales se limitan a identificar un fichero que se ha modificado y a copiar el fichero completo, incluso cuando sólo se ha modificado un único bloque, lo que consume grandes cantidades de ancho de banda de red y almacenamiento secundario. (Es de uso extendido la deduplicación de destino para reducir la cantidad de almacenamiento que los métodos tradicionales consumen, pero no mejora en absoluto los objetivos de punto o de tiempo de recuperación.)

La protección de datos integrada sólo transfiere la asignación de punteros y los bloques modificados que captura el proceso Snapshot, lo que suponer más velocidad y eficiencia. Desde la perspectiva del ancho de banda, este método es especialmente útil para empresas que replican de forma inmediata backups fuera de la instalación (por ejemplo, cuando se utiliza una estrategia de lugar remoto al principal) y necesitan minimizar la carga de conexiones WAN que resultan muy caras. (Un OC-3 que suministra 19,4 MBps cuesta en torno a 27.000 dólares al año.)

Almacenamiento de datos
Cuando se trata de almacenar datos, la mayor parte de las soluciones usan un formato de propiedad que dificulta o imposibilita el uso de los datos para cualquier otro propósito que no sea el de recuperación. Cuando los backups siempre se almacenaban en cinta, esto no importaba tanto porque se necesitaba una aplicación de backup para interactuar con el cambiador y las unidades de cinta.

La protección de datos integrada debe almacenar copias de los datos en un formato de sistema de ficheros abierto. Esto ofrece varias ventajas:

  • Los usuarios pueden ubicar y recuperar fácilmente sus propios ficheros sin que intervenga el administrador.
  • Puede aprovecharse de sus datos de backup para el desarrollo y las pruebas, de la extracción de datos, de la recuperación tras siniestros, del cumplimiento, etcétera.

Con la protección de datos tradicional, el objetivo es limitar el potencial para que los datos de backup se modifiquen de forma que la recuperación sería imposible. La protección de datos integrada puede garantizar que los datos de backup son de sólo lectura y que deben separarse para realizar operaciones de lectura y escritura.

Por ejemplo, la tecnología FlexClone® de NetApp® permite que se utilicen copias de datos secundarias con otros objetivos, sin realizar una copia completa del conjunto de datos. Estos clones editables de menor tamaño sólo consumen espacio de almacenamiento cuando se realizan cambios, por lo que utilizan el espacio de una forma eficiente, lo que le permite, a su vez, sacar el máximo partido de su almacenamiento secundario utilizado para los backups o la replicación basados en disco.

Los datos almacenados no tienen por qué ser datos en reposo. Con la protección de datos integrada, las imágenes de backup no se almacenan y se dejan en el disco o cinta cogiendo polvo. Se pueden utilizar para otras funciones de negocio, así como para ampliar la cadena de protección de datos. Las imágenes de backup pueden replicarse para la recuperación ante desastres y, a continuación, bloquearse para el cumplimiento, todo ello sin tener que gestionar diversas aplicaciones ni ejecutar varios procesos que requieren numerosos recursos en un servidor, lo cual podría afectar al rendimiento de las aplicaciones de la empresa.

Protección y recuperación de los datos de las aplicaciones

Las aplicaciones que se ejecutan de forman continua presentan unos requisitos especiales para la protección de datos. Ya que la mayoría de las aplicaciones almacenan en la memoria caché datos para mejorar el rendimiento, no basta con copiar los datos en disco de una aplicación para asegurarse de que son coherentes y están actualizados. Por este motivo, muchas aplicaciones comerciales y bases de datos ofrecen un modo de backup dinámico que permite crear backups o copias coherentes sin detener la aplicación. Ya que el modo de backup dinámico origina un bajo rendimiento en la aplicación en ejecución, hay que ejecutar la operación cuando la aplicación presenta una carga baja (lo cual no siempre es posible) o realizar la operación muy rápidamente.

Como las soluciones tradicionales de protección de datos, ya sea en cinta o en disco, suelen tardar bastante tiempo en llevarse a cabo, suelen tener que ejecutarse en las horas de mínima actividad.

Con la protección de datos integrada, en cambio, puede poner la aplicación en modo de backup dinámico, crear un Snapshot y volver a la actividad habitual en cuestión de minutos. Esto ofrece importantes ventajas:

  • Puede crear muchos Snapshots a lo largo del día para disponer de muchos más puntos de recuperación de lo que sería posible con otras soluciones.
  • Una vez conseguido un Snapshot coherente, puede conservarlo en el almacenamiento principal para su recuperación inmediata, copiarlo a un almacenamiento secundario o replicarlo a otra instalación para la recuperación ante desastres.

Recuperación de aplicaciones
Los backups tradicionales que tienen en cuenta las aplicaciones dejan los datos en un estado coherente de tal modo que la aplicación se puede reiniciar desde el punto en que se realizó el backup. Cuando hay que recuperar una aplicación (como una base de datos) a partir de backups tradicionales es necesario, en primer lugar, restaurar el backup más reciente y, a continuación, repetir los registros de transacción hasta que la base de datos se queda actualizada. La posibilidad de cometer un error u originar otros problemas que causen retrasos es bastante alta debido a que se trata de un proceso con varias fases.

Al iniciar una recuperación de aplicaciones con protección de datos integrada, puede recuperar de forma automática la aplicación hasta el momento en que falló sin necesidad de intervención manual. El software lleva a cabo todos los pasos necesarios para volver a un momento designado sin necesidad de intervención, lo cual ahorra tiempo y elimina la posibilidad de error por parte del usuario.

Soluciones de NetApp

NetApp ofrece un paquete de soluciones integradas de protección de datos creadas sobre la tecnología que ahorra espacio Snapshot™. Gracias al software SnapVault® de NetApp, puede realizar un backup de sus copias Snapshot en un almacenamiento secundario para su conservación online durante más tiempo. Sólo se transfieren los bloques modificados para usar eficazmente el ancho de banda de la red. El almacenamiento en servidores Windows®, Linux® y UNIX® estándar también se puede incluir mediante Open Systems SnapVault.

Para la recuperación ante desastres, NetApp suministra una replicación eficaz con SnapMirror®, que también replica únicamente los bloques modificados. Para la protección de datos mejorada dentro de un centro de datos o campus, MetroCluster de NetApp ofrece una disponibilidad continua de datos con mirroring síncrono para la mayor parte de las aplicaciones esenciales. Otro artículo de este número contiene un caso práctico de instalación de MetroCluster.

El backup de aplicaciones se consigue mediante el paquete SnapManager®, que se integra con aplicaciones de uso común, como Oracle®, SAP®, Microsoft® Exchange, SQL Server®, SharePoint® y VMware®. Estas herramientas pueden poner la aplicación en modo de backup dinámico, capturar una copia Snapshot coherente y, a continuación, reanudar las actividades normales en cuestión de segundos, lo cual sirve como base tanto para el backup como para la recuperación ante desastres. Para obtener una mayor eficiencia, las funcionalidades concretas de gestión del almacenamiento se pueden delegar directamente a los administradores de las aplicaciones.

Para las necesidades de archivado y cumplimiento normativo, SnapLock® de NetApp permite convertir cualquier volumen de NetApp de un almacenamiento principal o secundario en almacenamiento imposible de reescribir o borrar para evitar que los ficheros se modifiquen o se borren hasta cierta fecha de conservación determinada. En la figura 1 se ilustra toda la gama de herramientas de protección de datos integradas de NetApp.

Figura 1) La amplia gama de soluciones de protección de datos integradas de NetApp.

Conclusión

La protección integrada le permite:

  • Identificar de forma inmediata datos nuevos o modificados que necesitan backup o replicación
  • Trasladar los datos de forma eficiente
  • Almacenar los datos de forma eficiente en un formato abierto
  • Realizar backup coherentes con la aplicación para una posterior recuperación rápida

La protección de datos integrada ofrece importantes ventajas sobre las soluciones de protección de datos tradicionales. Casi todos los centros de datos pueden sacar partido de este método rápido y totalmente integrado para conseguir la protección de datos. En concreto, las operaciones de procesamiento de transacciones con gran carga de trabajo pueden aprovecharse de la protección de datos integrada gracias a la creación de puntos de recuperación más frecuentes y la rápida posibilidad de recuperación.

La protección de datos integrada también se ajusta a la perfección con la actual tendencia hacia el Cloud Computing. La capacidad para ofrecer un conjunto de servicios de protección de datos escalable y de fácil gestión tanto para sus clientes internos como externos es una parte fundamental de una infraestructura cloud completa.

NetApp ofrece un paquete completo de funcionalidades de protección de datos integradas que eliminan la complejidad y el alto coste de la protección global de datos.

¿Qué opina sobre la protección de datos integrada?

Formule preguntas, intercambie ideas y comparta sus opiniones en las comunidades online de NetApp.

Joshua Konkle

David A. Chapa
director, soluciones de backup y recuperación de datos
NetApp

David cuenta con más de 20 años de experiencia en el sector, durante los cuales se ha especializado en la disponibilidad de datos, la recuperación ante desastres y las prácticas empresariales de reanudación. Es coautor de Implementing Backup and Recovery: The Readiness Guide for the Enterprise (no editado en español), y es una autoridad reconocida en backup y recuperación, recuperación ante desastres y reanudación empresarial.

Joshua Konkle

Nathan Moffitt
director senior, soluciones de backup y recuperación de datos
NetApp

En sus más de 13 años en el sector de TI, Nathan se ha dedicado a las tecnologías de servidor, almacenamiento, redes y protección de datos. Además de diseñar e implementar soluciones utilizadas en todo el mundo por las empresas de Fortune 500, ha escrito una gran variedad de artículos relacionados con la protección de datos y los sistemas de ficheros compartidos.

 
En profundidad