Caso práctico de Suncorp: Cómo se crea un cloud privado En los últimos tiempos, Tech OnTap ha dedicado parte de su atención a cloud computing y a las tecnologías relacionadas, incluidas (entre otras muchas) la virtualización, multi-tenancy seguro o los mejores métodos para crear y proteger una infraestructura compartida. Este artículo se centra en un caso práctico en el que todos estos elementos se han condensado en un cloud privado completamente funcional y en continua y rápida evolución. Mientras que hace apenas dos años solo el 7% del negocio de Suncorp se generaba a través de Internet, en la actualidad esa cifra se ha disparado a más del 42%. Lo que nos permitió hacer realidad este cambio fue una transformación a gran escala de TI que ha mejorado increíblemente nuestra capacidad para poner en práctica una infraestructura que se adapte a las necesidades empresariales en continuo cambio. Nuestro esfuerzo total por estandarizar la infraestructura de TI (algo que conllevaba reemplazar el 80% del almacenamiento existente con NetApp®, virtualizar la mayor parte de las aplicaciones y proporcionar servicios basados en cloud simplificados) se ha traducido en serie de increíbles y eficientes mejoras:
Aunque estos logros son reseñables, igualmente importante para el avance de la compañía es que hemos conseguido una flexibilidad impresionante y hemos fomentado una cultura de la innovación que va más allá del entorno de TI. En este artículo ponemos de relieve algunos de los principales elementos de nuestro cloud privado que han hecho posible que hayamos materializado estos ahorros y mejorado la agilidad empresarial. Dado que todas las infraestructuras de TI son básicamente un trabajo en constante progreso, esperamos ofrecer una perspectiva abierta no solo del punto en el que nos encontramos actualmente, sino también de hacia dónde nos dirigimos en el futuro. Infraestructura estandarizada Al igual que otras muchas compañías de servicios financieros, una parte importante de nuestro crecimiento se debe a las fusiones y adquisiciones y, en consecuencia, cuando decidimos llevar a cabo la transformación hace cuatro años, nos vimos ante la pesada carga de un entorno de TI con aplicaciones en silos y una inmensa variedad de hardware de servidor, de red y de almacenamiento. El primer paso fue iniciar el proceso continuo de estandarizar y simplificar la infraestructura de TI todo lo posible, algo que conllevaba en gran medida reemplazar casi toda la infraestructura anterior. En la figura 1 se recogen los elementos principales de nuestra infraestructura actual, multi-tenancy seguro incluido (este último se describe más adelante). Figura 1) Elementos principales de la infraestructura física, incluidos aquellos que contribuyen al multi-tenancy seguro. Servidores Redes En cada centro de datos usamos 10 GbE, con lo cual los cables de fibre channel y los switches estructurales ya no son necesarios. De este modo, la infraestructura de cables es más sencilla y podemos aprovechar los recursos de red en ambas plataformas, por lo que ahorramos dinero. Actualmente estamos prescindiendo de más cableado aún, ya que estamos consolidando nuestro tráfico de LAN e IP SAN. Almacenamiento En total, disponemos de 49 controladoras de almacenamiento de NetApp con 3,7 PB de capacidad total de almacenamiento utilizable. Esto incluye un conjunto de sistemas de almacenamiento que se usan como servidores de archivos, más sistemas de almacenamiento en centros concentradores repartidos por todo el país. Todos nuestros sistemas FAS3100 emplean módulos Flash Cache de 512 GB y, a raíz del buen rendimiento obtenido, también estamos mejorando nuestros sistemas FAS6000. Flash Cache funciona proporcionando almacenamiento en caché inteligente que se adapta automáticamente a los cambios en la carga de trabajo para optimizar el rendimiento. Esto nos sirve para admitir el entorno de infraestructura de puestos de trabajo virtuales (VDI) que estamos poniendo en marcha en estos momentos (en la que nos detendremos más adelante) y, además, supuso una reducción notable de latencia en aplicaciones con datos estructurados. Por ejemplo, en relación con las aplicaciones Oracle® que consumen muchos recursos de I/O, se ha apreciado una caída de la latencia de lectura de 11 y 12 milisegundos a menos de 2 milisegundos cuando Flash Cache está habilitado. Alrededor de 350 TB del almacenamiento en los sistemas FAS6000 están dedicados a admitir VMware ESX. La puesta en marcha de todo nuestro entorno VMware sobre NFS fue muy positivo para nosotros en cuanto velocidad de la puesta en marcha y flexibilidad. Somos una de las puestas en marcha de VMware sobre NFS más grandes del mundo. La posibilidad de aprovisionar con antelación volúmenes muy grandes para VMware hizo que la transición al nuevo entorno fuera mucho más sencilla. Usamos la funcionalidad multiprotocolo de NetApp para almacenar la mayor parte de los datos de aplicaciones en LUN iSCSI en el mismo almacenamiento, de acuerdo con las recomendaciones de NetApp. Mientras implementamos SnapManager® para infraestructuras virtuales (SMVI), anticipamos la posibilidad de pasar a un entorno completamente NFS, para lo que escribimos los datos en discos VMDK. Las actualizaciones a SnapDrive® hicieron realidad esta estrategia. Nuestro entorno LPAR AIX de IBM también se ejecuta sobre NFS, convirtiéndolo en una de las instalaciones de este tipo más extensas del mundo. Thin provisioning, FlexClone y eficiencia del almacenamiento Al principio, y debido a las dudas sobre la capacidad de gestión, empezamos con todos nuestros volúmenes de almacenamiento con thick provisioning, pero hace 18 meses cambiamos a thin provisioning de NetApp en todo nuestro entorno de almacenamiento de NetApp. Thin provisioning nos ha permitido recuperar 1,9 PB de almacenamiento aproximadamente. Se trata a todas luces de un ahorro tremendo, y es que, al fin y al cabo, es 1,9 PB que no hemos tenido que comprar, montar en rack, poner en funcionamiento con energía y refrigerar en los últimos 18 meses. Operations Manager de NetApp nos ha permitido configurar alertas en los niveles de volumen y agregado. Estas alertas se envían a la herramienta de gestión empresarial en nuestro centro de operaciones nacional. Hemos establecido los niveles críticos por debajo de lo que lo haríamos en un entorno con thick provisioning. Cuando un agregado alcanza alrededor del 70% de su capacidad, dejamos de agregarle nuevos volúmenes y reservamos lo que queda para el crecimiento orgánico de los volúmenes ya existentes. Todos los meses realizamos tareas de gestión de la capacidad a fin de asegurarnos de que hay suficiente almacenamiento aprovisionado con antelación para dar cabida al crecimiento. Con la tecnología FlexClone® de NetApp, hemos podido aprovisionar rápidamente entornos de pruebas sin consumir una cantidad desmesurada de almacenamiento adicional. FlexClone permite crear clones virtuales de los volúmenes existentes en cuestión de segundos para usarlos en pruebas. Estos clones solo consumen capacidad de almacenamiento adicional a medida que se efectúan cambios y, cuando las pruebas finalizan, sencillamente liberamos los clones y, al instante, recuperamos todo el espacio de almacenamiento incremental que hayamos usado. También estamos implantando la deduplicación de NetApp en todo el entorno de almacenamiento y, hasta el momento, ya hemos recuperado unos 120 TB de capacidad. Esperamos que esta cifra sea mucho mayor, sobre todo cuando dedupliquemos nuestra entorno VMware. Nuestro propósito es llevar a cabo una deduplicación de los datos de manera predeterminada en el entorno VDI, que en estos momentos está en fase de implementación. Esperamos que la deduplicación reduzca nuestros costes de almacenamiento entre un 20 y un 30% más. Multi-tenancy seguro En Suncorp hemos implantado multi-tenancy seguro en el nivel de plataforma (Oracle, SQL Server®, MySQL, etc.) y no en el nivel de aplicación individual. Los volúmenes y LUN específicos de plataforma se encuentran en zonas de seguridad lógicas distintas. Implantamos multi-tenancy seguro a medida que se necesita en las zonas concretas para alcanzar nuestras metas específicas usando las funcionalidades de MultiStore® de NetApp. Los principales elementos de este método aparecen ilustrados en la figura 1. Iremos incorporando más funcionalidades de multi-tenancy seguro (tal y como se describe en un artículo de Tech OnTap® reciente) con el tiempo, a medida que implementemos el switch virtual distribuido de Cisco Nexus 1000V en nuestro entorno VMware en los próximos seis meses. Usamos un sistema de almacenamiento virtual de MultiStore (vFiler®) para cada plataforma de cada zona, según sea necesario. Tenemos una unidad de vFiler equivalente en la misma zona en nuestro centro de recuperación ante desastres. SnapMirror® de NetApp se utiliza para replicar datos entre el centro de datos primario y el de recuperación ante desastres (en la siguiente sección detallaremos en mayor profundidad la protección de datos y la recuperación ante desastres). Las aplicaciones principales de x86 y AIX se ejecutan en este entorno, y así, VMware, SQL Server, Oracle, SAS y nuestro sistema de gestión de reclamaciones Guidewire ClaimCenter. Multi-tenancy seguro nos ofrece la posibilidad de implementar varias aplicaciones en el mismo almacenamiento sin preocuparnos de la seguridad y, además, simplifica la gestión enormemente. Sin las estructuras de vFiler, tenemos que documentar minuciosamente la ubicación de cada volumen y LUN. Las unidades de vFiler lo organizan todo lógicamente de forma automática, de modo que las nuevas puestas en marcha se simplifican y aceleran y, al mismo tiempo, podemos aplicar normativas específicas de plataforma. A este respecto, aplicar normativas será mucho más sencillo cuando implementemos Protection Manager y Provisioning Manager de NetApp en los próximos meses. Catálogo de servicios de almacenamiento Siempre hemos estado convencidos de que disponer de un catálogo de servicios estandarizado es un requisito previo para lograr una infraestructura compartida, una virtualización y una puesta en marcha del cloud eficaces. Sin embargo, nuestro catálogo de servicios de almacenamiento anterior no bastaba para estandarizar nuestras ofertas. Ahora nuestro catálogo de servicios actual contiene únicamente cuatro ofertas básicas:
En cada una de las categorías disponemos de niveles de servicio de oro, plata y bronce. Por ejemplo, para nuestro servicio de DR ofrecemos lo siguiente:
Estos niveles se consiguen a través de Volume SnapMirror de NetApp con la configuración adecuada. Por ejemplo, para los datos estructurados lo normal es querer un nivel de servicio oro, lo cual significa que es necesario replicar registros cada cinco minutos para obtener un objetivo de punto de recuperación de 10 minutos. Nuestro servicio de backup proporciona backup basado en disco de SnapVault® de NetApp en una ubicación de almacén de datos distinto para poder realizar backups y recuperaciones operativos con subcategorías que especifican rendimiento y retención. En la actualidad, todas nuestras operaciones de archivado se efectúan en cinta para cumplir con los estrictos requisitos de regulación existentes. Este catálogo de servicios es válido para nosotros, aunque lo más probable es que sigamos centrando nuestros esfuerzos en simplificarlo hasta que quede el menor número de servicios posible sin poner en riesgo el funcionamiento. Servicios cloud Los distintos elementos descritos en la sección anterior (incluida una infraestructura estandarizada con arquitectura de multi-tenancy seguro y un catálogo de servicios de almacenamiento bien definido) conforman la base a partir de la que empezar a construir un cloud privado. Normalmente se definen ocho elementos principales como base de un entorno de cloud: automatización, estandarización de servicios, autoservicio, aprovisionamiento bajo demanda, virtualización, pools de recursos independientes de la ubicación, rápida elasticidad y seguridad. Antes de que implantáramos el cloud, implementamos nuestro modelo operativo basado en servicios, que incluía un catálogo de servicios y ofertas de los mismos para cada plataforma de infraestructura similares al catálogo de servicios de almacenamiento descrito en la sección anterior. Un elemento importante aquí era continuar simplemente con el proceso de estandarización de todas las plataformas y ofertas de servicio para que fueran más fáciles de automatizar. No adquirimos un producto de coordinación para implantar nuestro cloud privado; en su lugar, optamos por desarrollar nuestro propio modelo de coordinación, como se aprecia en la figura 2. Creamos robots de servicios web que servían para contener los productos de aprovisionamiento de primer nivel de nuestros principales partners, esto es, VMware, Cisco, NetApp, IBM, RedHat y Microsoft. Estos robots se conectan a un bus de servicios web común. Nuestra capa de coordinación se encuentra lógicamente por encima del bus de servicios web, mientras que nuestro portal de autoservicio se conecta a través de ella a los diversos servicios de aprovisionamiento que necesita. Figura 2) Arquitectura lógica de cloud de Suncorp. Los usuarios del portal pueden aprovisionarse en todos nuestros entornos con solo presionar un botón. Así, podrán obtener un pool de recursos y aprovisionarlo (o anular su aprovisionamiento) con suma facilidad, o pedir más recursos a través de la interfaz de cloud. Las ofertas actuales abarcan la infraestructura como servicio (IaaS) con equipos virtuales aprovisionados con Windows® 2008 o Red Hat Linux® y la plataforma como servicio (PaaS) con diversas plataformas, como Oracle, Microsoft® SQL Server, MySQL y JBoss. También nos estamos preparando para implementar puestos de trabajo como servicio (DaaS). Nuestra intención es ampliar la vida de los PC existentes convirtiéndolos para que usen VDI. Suncorp trabaja para crear entornos de trabajo inteligentes, con especial énfasis en la capacidad para la co-ubicación y los puestos de trabajo compartidos dentro de la organización. VDI admitirá estas funcionalidades. Actualmente, nuestra oferta de VDI se aprovisiona fuera del cloud, pero estamos trabajando para incluirla en él. Los usuarios podrán solicitar puestos de trabajo virtuales para su uso tanto en producción como en pruebas. Utilizaremos la funcionalidad de clonado rápido de Virtual Storage Console (VSC) de NetApp para suministrar esta funcionalidad mediante un método parecido al descrito en un artículo anterior. Los módulos de Flash Cache instalados en nuestro almacenamiento de NetApp posibilitará que nuestra infraestructura dé cabida al inicio de sesión y arranque masivos que pueden tener lugar en los entornos de VDI. Lo que perseguimos en última instancia es poder ofrecer una arquitectura como servicio (AaaS) en la que sea posible aprovisionar arquitecturas sencillas y estandarizadas donde todos los componentes de servidor, almacenamiento, alta disponibilidad de red, recuperación ante desastres, backup y recuperación y archivado estén estandarizados. Gracias a esto, los usuarios del cloud podrán acceder fácilmente a los recursos con la seguridad de que el cloud siempre va a proporcionar los niveles necesarios de protección de datos y cumplimiento de normativas. Conclusión Si bien este tema se ha tratado más en líneas generales que en profundidad, deseamos que sirva de descripción general de los métodos de Suncorp para poner en marcha un cloud y de cómo estamos haciendo realidad la transición al nuevo paradigma. Los cambios que ya hemos realizado han permitido que podamos reaccionar más rápidamente a los cambios empresariales y a las exigencias del mercado. Los costes se han reducido y estamos ofreciendo el triple de las funcionalidades que antes. Encontrará más información sobre Suncorp y las ventajas empresariales materializadas en un vídeo reciente y en un caso de cliente. ¿Tiene alguna opinión sobre el cloud privado?Formule preguntas, intercambie ideas y comparta sus opiniones en las comunidades online de NetApp. Tech OnTap Visite www.netapp.com/es/communities/tech-ontap/ para suscribirse hoy. | |
![]() | ![]() |
| Contacto | Cómo comprar | Comentarios | Trayectoria profesional | Suscripciones | Política de privacidad | © 2011 NetApp |