NetApp Tech OnTap

Implementación de 9.000 puestos de trabajo virtuales mediante clonación acelerada

La virtualización de puestos de trabajo permite actualmente a las compañías cambiar radicalmente la forma en que acometen sus actividades comerciales. Últimamente he trabajado con una compañía de externalización de procesos de negocio que aprovecha la tecnología de virtualización para eliminar la necesidad de disponer de centros de llamadas físicos. El equipo de TI está desarrollando una estrategia tecnológica que permitirá a miles de teleoperadores trabajar desde casa, con lo que la compañía podrá dejar de adquirir bienes inmuebles y obtendrá total acceso a una plantilla global.

Hacer que los teleoperadores trabajen desde casa presenta algunos retos especiales en lo que concierne a acceder a los datos más recientes, garantizar la seguridad y prestar soporte al entorno de trabajo de los agentes telefónicos. Emplear la virtualización de puestos de trabajo para permitir a 9.000 teleoperadores trabajar prácticamente desde cualquier ubicación con conexión supone un enfoque totalmente nuevo, y considero que los elementos de esta solución resultan muy interesantes para una amplia variedad de casos, no sólo el soporte telefónico:

  • La infraestructura de puesto de trabajo virtual (VDI, Virtual Desktop Infrastructure) de VMware® proporciona a cada teleoperador un entorno de trabajo seguro y personalizado que incluye las herramientas de soporte correspondientes.
  • La tecnología FlexClone® de NetApp® posibilita un provisionamiento rápido, que ocupa poco espacio, de los puestos de trabajo de los agentes telefónicos.
  • El software SnapMirror® de NetApp permite replicar los entornos de puesto de trabajo activos en los tres centros de datos de la compañía, de modo que un fallo en uno de ellos no suponga la pérdida de datos ni que los teleoperadores permanezcan offline durante un prolongado período de tiempo.
  • La telefonía por IP lleva la conexión telefónica del cliente hasta el hogar del agente.

En este artículo describiré los métodos que emplea la compañía para conectar y prestar soporte a usuarios de cualquier parte del mundo mientras desarrollan una infraestructura de gran escalabilidad que puede superar un fallo en el site con una incidencia mínima en los procesos continuos. Empezaré por el proceso de evaluación de la tecnología, describiré los detalles de su implementación y hablaré de los resultados obtenidos hasta ahora y de las tareas pendientes.

Elección de las tecnologías adecuadas

Hace aproximadamente seis meses, cuando me reuní con el equipo de TI de la compañía para hablar con ellos del almacenamiento, ya habían tomado una serie de decisiones relacionadas con las redes y el software de puesto de trabajo virtual. Dado que querían crear un entorno de puesto de trabajo adaptado a cada producto que ofrecían y que cada tipo de puesto de trabajo debía ser un elemento que se pudiera clonar, por ello se decidieron por una combinación de Citrix para proporcionar imágenes de puesto de trabajo y VMware para alojar estas imágenes. En ese momento ésta era la única forma de obtener todas las funcionalidades que necesitaban.

También optaron por iSCSI en lugar de Fibre Channel para el almacenamiento de gestión. La compañía se había comprometido en gran medida a utilizar la telefonía IP y contaba con una red IP global. Como resultado, el equipo de TI estaba convencido de utilizar este tipo de telefonía por su flexibilidad y deseaba ceñirse a él en la medida de lo posible.

Cuando el equipo vio la presentación de NetApp, tres fueron las tecnologías que despertaron su interés:

  • Soporte para varios protocolos. Aunque la compañía estaba convencida sobre el uso de iSCSI, el equipo de TI reconoció que la probada capacidad de NetApp para soportar cualquier protocolo les brindaría la posibilidad de cambiar si fuera necesario, y las ventajas de NFS en entornos virtuales también captaron su atención.
  • FlexClone. El equipo de TI reconoció inmediatamente que la tecnología FlexClone de NetApp podría proporcionarles la posibilidad de clonar entornos de puesto de trabajo y eliminar la necesidad de utilizar la combinación de Citrix y VMware por la que se habían decidido con anterioridad. La funcionalidad de clonación acelerada Rapid Cloning (RCU) versión 1.0 de NetApp ofrecía la integración necesaria entre VMware y Data ONTAP® de NetApp.
  • Deduplicación. Mientras que FlexClone de NetApp evitaría a la compañía tener que mantener 9.000 copias diferenciadas del entorno operativo del puesto de trabajo, el equipo de TI también sabía por experiencia que los teleoperadores acumulan grandes cantidades de datos no estructurados en el transcurso de su actividad. Enseguida se vio la deduplicación de NetApp como una forma de reducir esa necesidad de capacidad de almacenamiento. Por ejemplo, si los 9.000 teleoperadores almacenaran copias de un conjunto de ficheros de 1 GB, se necesitarían 9 TB de almacenamiento sólo para dicho conjunto.

Posteriores conversaciones contribuyeron a que el equipo de TI reconociera el valor de otras tecnologías de NetApp, entre las que se incluyen:

  • Performance Acceleration Module (PAM). La compañía ya sabía por las pruebas iniciales realizadas con sistemas de almacenamiento de otros proveedores que arrancar cientos de puestos de trabajo de forma simultánea supone una gran demanda para los subsistemas de disco. Es necesario poder satisfacer las demandas de I/O ante estos “arranques masivos” para que un gran número de teleoperadores puedan estar online rápidamente. El PAM alivia el impacto de estos arranques masivos al almacenar en caché los bloques que conforman la imagen de arranque tan pronto como se inicia el primer puesto de trabajo virtual, de modo que las restantes solicitudes de arranque se satisfacen en gran medida desde la caché.
  • SnapManager® para infraestructuras virtuales (SMVI). Aunque la mayoría de los puestos de trabajo virtuales de este entorno no serán persistentes y, por tanto, no requerirán backup (se crea un nuevo puesto de trabajo para cada teleoperador al inicio de cada sesión de trabajo), SMVI proporciona a la compañía una forma de automatizar la protección de los puestos de trabajo persistentes de agentes de soporte más especializados u otros usuarios que necesiten acceder al mismo puesto de trabajo de forma continuada para proseguir con su actividad.
  • SnapMirror. Cuando me reuní inicialmente con la compañía, el equipo de TI aún no había diseñado un plan de recuperación ante desastres para su entorno de puesto de trabajo virtual. El software SnapMirror de NetApp ofrece una forma de replicar regularmente el entorno de puesto de trabajo virtual activo desde un centro de datos a otro.

Este exclusivo conjunto de funcionalidades de NetApp permitió resolver muchos de los problemas a los que se enfrentaba la compañía, lo que hizo que el equipo de TI se replanteara sus anteriores decisiones a la hora de diseñar la arquitectura final.

Detalles de la implementación

La arquitectura final del entorno de puesto de trabajo virtual consta de cinco elementos principales:

  • “Pods” capaces de admitir hasta 2.400 usuarios y que constan de:
    • 2 compartimentos blade de HP de clase C con 32 blades de ocho núcleos, cada uno de ellos con 32 GB de memoria
    • Un sistema de almacenamiento FAS3160 de NetApp en cluster con 20 TB de almacenamiento en disco FC y 32 GB de memoria en 2 PAM
    • 4 switches blade Catalyst 3120
    • 2 switches Catalyst 4948
  • Virtual Desktop Manager (VDM) y ESX de VMware
  • RCU versión 1.0 de NetApp en cada sistema de almacenamiento NetApp para proporcionar funcionalidades de clonación
  • SnapManager de NetApp para infraestructuras virtuales para realizar backups automatizados y recuperaciones rápidas y coherentes con la aplicación
  • Software SnapMirror de NetApp para la replicación de sites remotos

Con la implementación de dos de estos pods en cada uno de sus tres centros de datos, la compañía podrá tener hasta 9.000 usuarios con tan solo dos centros de datos en funcionamiento. SnapMirror permitirá replicar los entornos de puesto de trabajo activos de cada centro de datos en otro site para proporcionar una total redundancia y capacidad de recuperación en caso de que un centro de datos quede offline.

Enfoques típicos para mejorar el rendimiento de las aplicaciones

Figura 1) Infraestructura de clonación acelerada utilizada para crear hasta 9.000 puestos de trabajo virtuales.

Clonación para un rápido provisionamiento de puesto de trabajo virtual. El proceso de clonación permite crear copias de una imagen de puesto de trabajo con las herramientas y otros recursos adecuados para cada proyecto en el que trabaje la compañía. Utiliza RCU de NetApp para clonar instancias de cada entorno en función del número de agentes telefónicos contratados para trabajar en un proyecto concreto. RCU crea automáticamente un fichero de importación que se ubica en el Virtual Desktop Manager de VMware de modo que todos los puestos de trabajo virtuales queden registrados en VDM y listos para su utilización. El puesto de trabajo virtual se clona como una imagen virtual no persistente. Esta configuración hace que cualquier cambio introducido en el puesto de trabajo durante la sesión de trabajo del teleoperador se elimine una vez que el agente telefónico cierre sesión en el puesto de trabajo virtual. El estado no persistente garantiza que el entorno de soporte sea estándar y elimina la necesidad de ofrecer soporte continuado al entorno de puesto de trabajo personalizado.

NFS sustituye a iSCSI. Cuando empezamos a diseñar la arquitectura final, volvimos a estudiar la adopción de iSCSI. En última instancia, el equipo de TI optó por adoptar NFS en lugar de iSCSI por las razones siguientes:

  • Número de equipos virtuales por LUN o volumen. Según los resultados sobre virtualización de servidores obtenidos por NetApp y otros proveedores de almacenamiento, lo normal es contar con entre 16 y 25 equipos virtuales de servidor por cada LUN en una implementación de virtualización de servidores. Con unos datos limitados sobre la relación de dimensionamiento del puesto de trabajo virtual a la LUN, calculamos que estaría entre 30 y 75 por LUN. A modo de comparación, un proyecto de virtualización de servidores en el que había participado con anterioridad incluía 200 equipos virtuales de servidor por volumen NFS.
  • Impacto sobre el servidor ESX. Una reciente prueba de rendimiento multiprotocolo con VMware demostró que NFS tiene menos impacto sobre los procesadores ESX que iSCSI. Un menor uso de CPU supone la posibilidad de asignar más equipos virtuales a cada servidor.
  • Provisionamiento. Con miles de equipos virtuales, queríamos que el entorno de provisionamiento fuera lo más sencillo y fácil de utilizar posible, y que se dedicara menos tiempo a la gestión del rendimiento de almacenamiento. Después de consultar diversas cuentas de referencia de NetApp/VMware, el equipo de TI convino en que NFS era la mejor elección, dada su combinación de rendimiento, escalabilidad y facilidad de gestión.

Resultados obtenidos y tareas pendientes

En la actualidad, la compañía tiene un pod completamente implementado para tareas de producción y un segundo en proceso de implementación. El equipo de TI está muy satisfecho con los resultados obtenidos hasta ahora:

  • Proceso de clonación. Actualmente, dos funcionalidades de NetApp proporcionan beneficios al proceso de clonación. La funcionalidad de lectura limitada, escritura múltiple (rfwm, read-few-write-many) crea de forma eficiente copias de equipos virtuales dentro del almacén de datos. FlexClone de NetApp se ejecuta para clonar varias copias del almacén de datos que consumen poco espacio. El tiempo necesario para completar este proceso varía en función del número de equipos virtuales del almacén de datos y el número de copias de volumen de dicho almacén de datos que se necesiten. Se espera que la tecnología FlexClone de disponibilidad en el nivel de ficheros de Data ONTAP 7.3.1 proporcione tiempos de clonación aún menores y se prevé su implementación.
  • Rendimiento de arranque. PAM multiplica por cuatro el rendimiento de arranque en comparación con los procesos de arranque realizados sin caché.
  • Rendimiento de puesto de trabajo. Hasta ahora, los puestos de trabajo virtuales han mostrado un excelente rendimiento. La mayoría de los usuarios afirma que el rendimiento es superior al de los sistemas operativos locales.
  • Seguridad. Proporcionar a los teleoperadores que trabajan desde casa un puesto de trabajo tradicional que incluya información importante que deba protegerse a través de un cortafuegos local supone todo un reto para la seguridad. Dado que los puestos de trabajo virtuales se ejecutan en el centro de datos de la compañía, se elimina este riesgo para la seguridad. Los teleoperadores acceden a los puestos de trabajo virtuales a través de conexiones de red privada (VPN) que garantizan la seguridad. Los puestos de trabajo virtuales pueden incluso proporcionar acceso directo a la compañía del cliente. Por ejemplo, un agente que proporcione soporte de software puede tener acceso directo a informes de problemas, bases de datos de resolución de problemas y recursos internos de productos de la compañía de software. Dado que estas conexiones de red se dan entre los centros de datos corporativos con el nivel de seguridad adecuado, el riesgo es mucho menor que si los agentes remotos accedieran directamente a estos recursos desde casa.
  • Posibilidad de prestar soporte a los centros de llamadas existentes. Aunque el principal objetivo de este proyecto era el de prestar soporte a teleoperadores remotos, la compañía está haciendo la transición para utilizar este mismo método para prestar soporte a los centros de llamadas existentes. El uso de puestos de trabajo virtuales simplifica enormemente los procedimientos de soporte a los agentes de los centros de llamadas y contribuye a garantizar la uniformidad del servicio. Todos los teleoperadores tienen las mismas herramientas y recursos, y resulta sencillo conseguir que todos estén actualizados.
  • Recuperación ante desastres en puestos de trabajo. En entornos como éste, los puestos de trabajo de los empleados son esenciales para el negocio, pero resulta difícil, y a veces hasta imposible, proporcionar un nivel razonable de recuperación ante desastres a un gran número de sistemas físicos geográficamente dispersos. La virtualización de puestos de trabajo facilita la protección de este recurso fundamental. Si falla el hardware de visualización de un agente, éste podrá acceder completamente al puesto de trabajo mediante otro hardware. La ejecución de los puestos de trabajo virtuales está protegida mediante su replicación en un centro de datos paralelo.
  • Ausencia de hardware remoto. Los teleoperadores que trabajen desde casa necesitan una conexión a Internet de banda ancha y un equipo compatible con Internet Explorer, de modo que la compañía no tiene que suministrarles recursos de hardware ni prestarles soporte.

Durante los próximos 18 meses el equipo de TI prevé centrarse en la implementación de los pods restantes y habilitar la recuperación ante desastres entre centros de datos. Una vez se haya completado el proyecto, el impacto sobre las actividades comerciales de la compañía, en realidad sobre la forma en que ésta las lleva a cabo, será significativo.

Conclusión

La realidad económica actual obliga a las organizaciones a incrementar su eficiencia con planteamientos diferentes. La compañía estudiada en este caso práctico se replanteó todo el enfoque que aplicaba al negocio de los centros de datos, lo que resultó en una infraestructura con un mantenimiento mucho más barato mientras disfruta de nuevas e importantes funcionalidades y una plataforma que le permitirá un abordar un crecimiento global. La virtualización de puestos de trabajo combinada con las funcionalidades exclusivas de almacenamiento de NetApp hizo realidad esta implementación.

¿Qué opina sobre la virtualización de puestos de trabajo?

Formule preguntas, intercambie ideas y comparta sus opiniones en las comunidades online de NetApp.


Trey Layton

Trey Layton
Systems Engineer
NetApp

Trey trabaja con NetApp desde 2006, donde se ha especializado en el diseño de centros de datos de última generación con VMware. Su amplia experiencia en redes y virtualización lo convierten en un especialista único en la actual evolución hacia el almacenamiento en red. Con más de 18 años de experiencia en el campo de las TI, Trey inició su carrera profesional en el Mando Central (USCENTCOM) del ejército estadounidense, en el que prestaba soporte a los grupos especiales que operaban en Oriente Medio. También ocupó importantes cargos en los departamentos de ingeniería de sistemas y consultoría en Eastman Kodak, GE y Cisco Systems.

En profundidad