NetApp Tech OnTap

Archivado para 100 años

¿Está preparado?

Tome un libro con 100 años de antigüedad y probablemente podrá leerlo sin muchos problemas, pero tome una cinta de copia de seguridad que tenga una antigüedad de 10 o 20 años y probablemente tendrá más problemas. Incluso aunque tenga el hardware apropiado para leer la cinta (y la propia cinta se encuentre en buenas condiciones), debe conocer el formato en el que fue grabada y necesitará una aplicación que pueda interpretar los datos. La situación puede ser muy complicada e incluso puede empeorar con el tiempo.

En este momento puede estar pensando: “Está bien, no necesito guardar los datos tanto tiempo.” Piénselo de nuevo.

Data retention requirements

Figura 1) Requisitos para la conservación de los datos.
Fuente: Estudio de SNIA

En 2007, la SNIA (Storage Networking Industry Association) completó un amplio estudio mediante el cual hablamos con cientos de personas de un amplio espectro de organizaciones de países de todo el mundo. Un asombroso 80% afirmó que tienen información que deben conservar durante más de 50 años, y el 68% afirmó que tienen que guardar los datos durante más de 100 años. Un 70% también informó de su alta insatisfacción con la capacidad percibida de leer la información conservada dentro de 50 años. ¿Con qué tipo de datos estaban más preocupados? Correo electrónico, registros de clientes, datos de aplicaciones de negocio y bases de datos - los tipos de información con los que más tratamos todos los días.

¿He logrado captar su atención?

En este artículo, explicaremos los retos del archivado a largo plazo, abordaremos algunas de las mejores prácticas que pueden utilizarse y hablaremos sobre los esfuerzos realizados tras la LTACSI (Long Term Archive and Compliance Storage Initiative, Iniciativa de archivado a largo plazo y almacenamiento ”compliance”) de la SNIA, que presido.

¿Cuáles son los retos de archivado a largo plazo?

En la Figura 2 se explica el reto de la retención de datos a largo plazo.

Figura 2) Duración característica de los sistemas de almacenamiento, aplicaciones y soportes físicos con respecto a la conservación de la información.

En pocas palabras, el tiempo que necesitamos retener la información (incluso utilizando la cifra más modesta de 50 años) sobrepasa con creces la duración típica de los sistemas de almacenamiento (disco o cinta) y de las aplicaciones. Incluso los soportes físicos comienzan a degradarse y es posible que no puedan leerse antes de que concluya el período de retención.

La práctica actual es migrar los datos, tanto física como lógicamente, de 3 a 5 años. La migración física requiere trasladar la información desde un sistema de almacenamiento físico a otro, o bien desde un formato a otro, para mantener la legibilidad, accesibilidad e integridad físicas. Los factores para este tipo de migración incluyen fallos en los soportes, obsolescencia de los soportes o del sistema de almacenamiento, cambios del sistema y coste de las operaciones (personal, potencia, espacio).

La migración lógica requiere trasladar la información de un formato lógico a otro, por ejemplo, de una versión antigua de una aplicación a una nueva versión, para conservar la legibilidad y la interpretabilidad. Entre los factores puede incluirse el cambio de formatos de la aplicación, aplicaciones obsoletas y fusiones. Entre los inhibidores para ambos tipos de migraciones se incluyen el coste, la complejidad, el volumen transparente de la información y la falta de tiempo o de presupuesto.

El estudio de la SNIA anteriormente mencionado concluyó que la migración lógica y física simplemente no escala el coste de forma eficaz para adaptarse a las necesidades actuales y futuras. De hecho, sólo el 30% de los casos estudiados migran los datos cada 3 o 5 años si están en disco. Claramente, se necesitan nuevos métodos que cumplan los requisitos legales, normativos, comerciales, económicos y de escalabilidad para la retención de información digital a largo plazo.

Soluciones provisionales

Las limitaciones impuestas por los sistemas de almacenamiento y las aplicaciones actuales desaparecerán a corto plazo. ¿Qué debería hacer hoy para hacer frente a la retención a largo plazo? La mejor recomendación actualmente es implementar los procesos de gestión del ciclo de vida formal de sus aplicaciones, operaciones y depósitos de datos para hacer frente a la gestión eficaz de los datos a través de su vida útil. Entre las mejores prácticas deben incluirse:

  • Estrecha colaboración entre los accionistas (TI, RIM, departamentos legal, comercial, seguridad) para garantizar que todas las necesidades quedan cubiertas
  • Identificación clara de todos los activos y recursos existentes
  • Clasificación de la información de modo que puedan determinarse las necesidades de retención
  • Establecimiento de los requisitos para la retención, protección, seguridad, conformidad, etc.
  • Implementación del servicio para cumplir los requisitos
  • Medida y mejora

Entre las prácticas de utilidad pueden incluirse:

  • Clasificar información en unos pocos grupos comunes
  • Ajustar los períodos de retención y borrar los datos que hayan caducado
  • Controlar el número de copias de datos que se mantienen para la protección de los mismos
  • Definir las políticas para auditorías y llevarlas a cabo
  • Utilizar plataformas de almacenamiento basadas en estándares

Su política de conservación a largo plazo debe identificar los objetivos comerciales, legales y de conformidad e incluir una descripción de las mejores prácticas a las que debe adherirse cada depósito de almacenamiento, incluida la migración tanto física como lógica. El objetivo de la migración física debe ser pasar de una migración a plazo fijo (entre 3 y 5 años) a una estrategia “según se necesite”. Los sistemas federados basados en estándares y virtualizados (como el almacenamiento NetApp® que ejecuta Data ONTAP® GX) pueden ayudar a minimizar la interrupción, la complejidad y el trabajo implícito en la migración.

Para la migración lógica, debe ser capaz de mantener la autenticidad, la prueba de que los datos son lo que eran originalmente. Una vez más, sólo debe migrar según necesite, y debe tener en cuenta otras opciones para retener algunos datos: convertirlos en un formato estándar (XML, PDF, etc.), archivar una copia impresa, si el caso lo requiere, o utilizar microfilm.

ISi esto parece complicado, lo es. Aun así, tiene que ejecutar tanto la migración física como la lógica según necesite y es posible que ambos eventos no coincidan. Pero actualmente existen algunas opciones para garantizar que los datos retenidos durante un largo plazo sigan siendo legibles. Afortunadamente, algunos esfuerzos importantes están dando fruto para ayudar a afrontar esta situación.

Esfuerzos estándar

Está bastante claro que el sector del almacenamiento no ha hecho mucho por afrontar el problema de la retención de datos a largo plazo hasta hoy. Las aplicaciones de archivado actuales utilizan formatos de datos de propiedad que le abocan a una única solución que en el futuro podría complicar los esfuerzos de migración. Se trata básicamente de cambiar.

Para el archivado a largo plazo (más de 15 años), el mayor reto es la migración lógica. La situación de la migración física puede abordarse de la forma adecuada con procesos de gestión del ciclo de vida eficaces y con la tecnología de almacenamiento actual basada en estándares, en oposición a los formatos de almacenamiento de propiedad. La situación debe mejorar más conforme los distribuidores empiecen a centrar más la atención en el hardware que puede satisfacer las necesidades de almacenamiento a largo plazo. (Para ver un ejemplo, consulte en la barra lateral Investigación colaborativa en archivado a largo plazo.)

La migración lógica, por otra parte, sigue siendo específica de la aplicación, dificultando más la automatización de los procesos clave. La “conservación” completa requiere algo más que simplemente conservar los datos legibles e interpretables, requiere la retención a largo plazo de los datos con metadatos que incluyan su procedencia, su información de referencia (contexto) y mecanismos para garantizar su integridad y autenticidad.

En lo que a esto respecta, la LTACSI de SNIA propuso que la SNIA formara un grupo de trabajo técnico para la retención y conservación de la información digital a largo plazo para investigar la encapsulación (véase barra lateral). La encapsulación definiría un contenedor lógico “orientado a la conservación” compuesto por el contenido (los datos) y los metadatos de conservación asociados.

La encapsulación podría modelarse en el AIP (Archival Information Package, paquete de información de archivado) de OAIS. La Figura 2 muestra el contenido de un contenedor AIP de OAIS.

Figura 3) El AIP de OAIS incluye el contenido de la información que se va a almacenar y los metadatos que describen dicho contenido. (Fuente: SNIA)

La encapsulación implica “autocontenido” porque un contenedor incluye los datos de la información, sus metadatos, la información de referencia, las comprobaciones de integridad y de autenticidad, los controles de acceso y los registros. Este contenido hace que el contenedor sea portátil e independiente del almacenamiento. Permite que el contenedor se gestione independientemente de la aplicación, de acuerdo con los requisitos establecidos para la información.

La encapsulación es “autodescriptible” porque el contenedor podría interpretarse mediante diferentes tipos de sistemas y porque puede incluir lectores, lo que permite que el contenido se interprete independientemente de la aplicación. Esta capacidad es importante para la conservación a largo plazo. La encapsulación proporciona un formato estándar que cualquier aplicación puede comprender y que, en teoría, permite a muchos tipos de aplicaciones acceder al contenido archivado, como ECM, legal, migración, conservación, etc.

Figura 4) Lógicamente, la encapsulación crea una capa de datos estándar que se incluye entre la capa de bits (soportes físicos) y la aplicación. (Fuente: SNIA)

El objetivo es eliminar la necesidad de las frecuentes migraciones lógicas de forma que las organizaciones puedan continuar accediendo y utilizando los datos archivados según precisen a lo largo de mucho tiempo sin la sobrecarga y la complejidad de actualizar regularmente los datos para que se adapten a los cambios de las aplicaciones.

NetApp y archivado a largo plazo

Desde la perspectiva del hardware, NetApp ha reconocido claramente que las migraciones de datos físicos, ya sea para archivado o para otros fines, son complicadas y perturbadoras. Por esta razón, NetApp se dirige hacia una arquitectura de hardware con escalabilidad horizontal que admite el almacenamiento por niveles, incluidos volúmenes de única escritura y múltiples lecturas (WORM) por necesidades de conformidad, para facilitar la migración de los datos de un nivel a otro sin interrupciones. Esta arquitectura permite la incorporación transparente de nuevos cimientos (soportes físicos, controladores de almacenamiento) en todo el almacenamiento existente, simplificando en gran medida el proceso de migración físico.

Con el fin de cumplir los requisitos de archivado y conformidad, la tecnología abierta de SnapLock® de NetApp permite la creación de volúmenes WORM en almacenamiento NetApp para cumplir los requisitos normativos y de la dirección corporativa sin necesidad de separar físicamente los sistemas de almacenamiento. NetApp trabaja con socios de archivado líderes del sector, como Symantec, Zantaz y CommVault para ofrecer soluciones que aprovechan las características únicas de la tecnología de hardware y software de NetApp, y también colabora con estos socios en soluciones a largo plazo.

Desde el punto de vista de la migración lógica, NetApp sabe que solventar los problemas de archivado a corto plazo es sólo parte de la solución. Identificamos pronto la necesidad de estándares del sector y hemos sido un colaborador clave en los esfuerzos de estandarización. En mi función en NetApp, una de mis responsabilidades como responsable es presidir la LTACSI, un esfuerzo de cooperación de los usuarios finales, profesionales de TI, distribuidores, integradores y proveedores de servicios que tienen interés en afrontar los retos de la retención de información digital a largo plazo, archivado y prácticas de almacenamiento relacionadas con la conformidad.

¿Qué debería hacer ahora?

Lo más importante es empezar a dar los pasos necesarios para evitar terminar en una situación de crisis con terabytes de datos que requieren la migración física y/o lógica. La mejor forma de hacerlo es seguir las directrices que se describen en “Soluciones provisionales,” incluido el uso de estándares abiertos siempre que sea posible. Los estándares abiertos le proporcionan muchas más opciones a la hora de realizar la migración y ayudan a evitar los compromisos que generan los estándares cerrados.

Si su organización todavía no lo ha hecho, considere implementar la clasificación de datos para comprender mejor sus datos y respaldar la gestión del ciclo de vida. A continuación, busque soluciones, tanto de hardware como de software, que puedan hacer cumplir políticas y simplificar el proceso de migración físico. Al dar estos pasos ahora, estará posicionado para beneficiarse de nuevos estándares de archivado a largo plazo conforme vayan tomando forma en los años venideros.

Gary Zasman

Gary Zasman
Worldwide Practice Director
NetApp

Gary trabaja con presidente de la LTACSI (Long Term Archive and Compliance Storage Initiative, Iniciativa de archivado a largo plazo y almacenamiento ”compliance”) de SNIA. También encabeza el desarrollo de la práctica mundial de NetApp para aplicaciones de negocio e integración de bases de datos. Antes de su incorporación a NetApp en 2006, Gary ocupó una serie de puestos en distribuidores de almacenamiento líderes del sector centrándose en el desarrollo de soluciones ILM y prácticas de consultoría. En 2001, un equipo con el que Gary trabajó fue seleccionado como finalista del prestigioso Computerworld Smithsonian Award por desarrollar un archivo digital de la historia visual.

Explore