Caso práctico: Thomson Reuters En Thomson Reuters, nuestra misión es satisfacer las necesidades informativas de las empresas y los profesionales de una amplia gama de especialidades, por lo que la tecnología de la información es esencial para todo lo que hacemos. Las bases de nuestro enfoque actual de TI se sentaron hace más de 10 años, cuando Westlaw, nuestro servicio de investigaciones legales en línea, empezó a afrontar desafíos de estabilidad. En ese momento, antes de las crisis de las empresas punto com, Westlaw era todavía una plataforma heredada basada en entorno mainframe, lo que nos hizo perder a ingenieros de software talentosos que querían trabajar con tecnologías más nuevas. Me encomendaron la creación de una infraestructura nueva y abierta para Westlaw que también pudiera dar soporte al resto de nuestras áreas de información. La creación de una infraestructura compartida con componentes básicos estándar resultó ser un pedido muy adelantado para su tiempo. Esta directiva simple nos encaminó hacia una evolución constante de la TI a lo largo de los años y, más recientemente, contribuyó al lanzamiento exitoso de un servicio de investigación legal de última generación totalmente nuevo: WestlawNext. Nuestra infraestructura nos permitió agregar soporte para WestlawNext al tiempo que ahorramos unos $65 millones en costos de centros de datos nuevos, con un consumo de energía 25% menor y disponibilidad todo el día, todos los días del año. WestlawNext tiene la capacidad de buscar en una cantidad de datos 50 veces mayor (5000 millones de documentos) que la generación anterior y genera los resultados el doble de rápido.En este artículo, quiero destacar algunos de los elementos importantes de esta infraestructura, como los componentes básicos, nuestra arquitectura central de búsqueda y nuestro sistema "front-end" virtualizado. NetApp y los servicios profesionales de NetApp fueron socios invaluables en esta iniciativa, por lo que también trataré de reconocer el mérito como corresponde. Una infraestructura compartida de TI para la búsqueda La clave del éxito de WestlawNext y de todos los productos de Thomson Reuters es la capacidad de hacer búsquedas en una cantidad enorme de datos con mucha rapidez y precisión absoluta. Si dos personas hacen la misma búsqueda al mismo tiempo, deberían obtener exactamente los mismos resultados. Gracias a las mejoras en los métodos de búsqueda de WestlawNext, los usuarios pueden pedir lo que necesitan en idioma corriente, sin necesidad de saber cómo armar una consulta formal. Como resultado, una consulta que generaba una sola búsqueda dos o tres años atrás ahora produce 40 o más búsquedas de "back-end", y nuestra infraestructura todavía tiene la capacidad de ampliarse para satisfacer esta carga, lo que es realmente asombroso. Ha superado por mucho los objetivos originales. Una búsqueda típica tarda apenas 2,5 segundos en devolver datos al cliente. Los elementos clave de nuestra infraestructura incluyen:
Componentes básicos estándar
Figura 1) Logros sobresalientes de WestlawNext y la transformación de la TI de Thomson Reuters Novus: infraestructura tipo nube para las búsquedas El sistema Novus es una arquitectura distribuida de búsqueda que usa miles de servidores SUSE Linux® que ejecutan nuestro software de propiedad exclusiva. Cada servidor es responsable de una parte del índice de contenido general, que cabe en la memoria del servidor por lo que puede consultarse muy rápidamente. Cuando se ejecuta una búsqueda, se consultan miles de máquinas al mismo tiempo. Los resultados se envían a un controlador, que los ordena, los agrupa, los clasifica y envía esta información a la aplicación solicitante. De esta manera, podemos obtener un rendimiento de búsqueda de menos de un segundo. Luego la aplicación decide si desea consultar los documentos identificados en la búsqueda. Los almacenes de contenido no se llegan a consultar hasta que se solicita un documento. El contenido en sí se almacena en cientos de clusters de base de datos Oracle® RAC, generalmente con cuatro nodos por cluster. Cada cluster tiene un subconjunto del contenido total. Sé que el término "nube" significa algo diferente para cada persona, pero Novus está diseñado para proporcionar la flexibilidad que suele caracterizar a la infraestructura en nube, aunque la infraestructura se diseñó antes de que se popularizara este término. Todos los servidores del entorno de Novus pueden reasignarse en tiempo real para adoptar otra función. Cuando diseñamos esto, nos quisimos asegurar de que si había un evento pico, podríamos reasignar recursos muy rápidamente para, por ejemplo, convertir un servidor de base de datos en un servidor de búsqueda. Cuando instalamos código en Novus, todo el código se instala en todos los servidores para todas las funciones. Por esto, lo único que tenemos que hacer es un simple ajuste, algo así como decirle al servidor A que ya no es un servidor de búsqueda, sino que es un servidor de carga. Si WestlawNext está recibiendo muchas consultas, podemos asignarle más recursos específicamente, lo mismo con Checkpoint o con cualquier otra aplicación que necesite más recursos. No hace falta reiniciar los servidores, basta con que carguen en memoria los índices correspondientes del almacenamiento de NetApp y estarán listos para la nueva función. Varios conjuntos de servidores pueden asignarse al mismo conjunto de índices para aumentar el paralelismo y que Novus se pueda seguir ampliando. Esta capacidad dinámica también nos permite integrar la redundancia en el entorno y garantizar la precisión de los resultados. Siempre tenemos otros servidores inactivos disponibles. Si pasados apenas unos pocos milisegundos de haber enviado una solicitud no recibimos un resultado de un servidor, hacemos algunas pruebas rápidas del servidor. Si no responde, funciona lento o tiene algún otro problema, otro servidor se asigna automáticamente para cumplir esa función. Este servidor cargará en memoria el índice correspondiente y atenderá la solicitud. El resultado final es que un servidor puede fallar y el usuario aún así recibirá un resultado preciso sin omisiones y con apenas unos pocos segundos de demora. El usuario no tiene que volver a enviar la solicitud; la recuperación sucede automáticamente sin intervención del administrador. Para el contenido de Novus en sí, el uso de Oracle RAC aporta redundancia. Si un servidor RAC falla, otro nodo del cluster cumplirá su función. Si un cluster RAC está recibiendo muchas consultas, podemos agregar más nodos de manera dinámica para adaptarnos a la carga. Sistema "front-end" virtualizado Gran parte del entorno "front-end" se ha virtualizado con VMware®. La mayoría de los servidores web y los servidores de aplicaciones se ejecutan en máquinas virtuales. VMware nos permite hacer en el sistema "front-end" el mismo tipo de asignación dinámica de recursos que hacemos en Novus. Podemos optimizar la cantidad de servidores web y servidores de aplicaciones para cada aplicación según sea necesario. VMware también nos permite operar sin interrupciones. HA de VMware ofrece protección contra fallas de máquinas virtuales y vMotion™ permite hacer mantenimiento y otras operaciones sin tiempo de inactividad ni pérdida de trabajo en proceso, algo que antes era imposible. Antes de la virtualización, si tenía 100 usuarios en un servidor que necesitaba mantenimiento, debía detener sus actividades, desconectarlos y pedirles que volvieran a iniciar sesión (o hacer algún truco de magia de programación, lo que resultaba casi imposible). Con VMware, podemos hacer tantas tareas de mantenimiento como sea necesario durante el día porque simplemente podemos mover las VM en ejecución a un conjunto auxiliar de servidores, para luego hacer las tareas de mantenimiento necesarias en los servidores originales. Recuperación tras desastres Usamos la replicación para mantener sincronizados nuestros centros de datos. Hemos desarrollado nuestros propios mecanismos de replicación para admitir la replicación de los índices de Novus y asegurarnos de que estén perfectamente sincronizados. Los almacenes de contenido de nuestras bases de datos de Oracle RAC se replican con Oracle DataGuard. NetApp cambia las reglas del juego El almacenamiento de NetApp admite la arquitectura de Novus (índices y almacenes de contenido de Oracle RAC), así como el entorno "front-end" de VMware. Todos los índices alojados en nuestros servidores Linux y todo el contenido almacenado en Oracle RAC se guardan en almacenamiento NAS de NetApp, al que se accede mediante NFS. Novus simplemente no podría funcionar si miles de servidores no pudieran compartir el acceso a nuestros sistemas de almacenamiento al mismo tiempo, con la capacidad de cambiar de manera dinámica qué servidor accede a qué sistema de almacenamiento sobre la marcha. El almacenamiento de NetApp realmente cambió las reglas del juego cuando lo implementamos por primera vez en 2002, y sigue siendo una parte esencial de nuestra solución actual. Para satisfacer los requisitos de escalabilidad y rendimiento de WestlawNext, hicimos algunas mejoras recientes en la infraestructura. Agregamos Flash Cache a los sistemas clave de NetApp. Específicamente, empezamos a usar esta tecnología en los sistemas de NetApp que proporcionan almacenamiento para un solo cluster de Oracle RAC. Estos clusters suelen tener requisitos de baja capacidad y alto rendimiento, por lo que Flash Cache ayuda a mantener un rendimiento alto sin tener que agregar discos físicos ni desperdiciar capacidad para obtener el rendimiento necesario. También empezamos a usar Flash Cache en los sistemas de almacenamiento compartido que proporcionan los índices y otros datos a nuestros clientes de Linux; las pruebas preliminares indican que tendrá un impacto igual de importante aquí. Como es de esperarse, agregamos contenido nuevo todo el tiempo, lo que significa que debemos rearmar los índices y retirar el contenido nuevo y los índices asociados mientras mantenemos todo sincronizado. Si se produce un problema y tenemos que revertir a un estado anterior, esto debe hacerse lo más rápido posible. La tecnología SnapRestore® de NetApp es por lejos la mejor solución que puede lograr esto. Antes de hacer una carga de contenido, creamos una copia Snapshot™. Entonces, si tenemos que revertir a un estado anterior por algún motivo, simplemente podemos ejecutar una operación de SnapRestore para que nuestro almacenamiento (en un centro de datos y luego en otro) vuelva al estado en el que estaba antes de iniciar la carga. (En algunos casos, para las bases de datos, es posible que se deban repetir los registros). Usamos la deduplicación de NetApp en nuestro entorno de VMware para eliminar la duplicación generada por tener una gran cantidad de VM casi idénticas. Una sola división tiene más de 9000 VM de VMware en ejecución en almacenamiento de NetApp; hemos podido ahorrar más de 160 TB de espacio de almacenamiento primario gracias a la deduplicación. Para gestionar nuestro entorno, usamos el conjunto completo de productos de gestión OnCommand™ de NetApp, incluidos Operations Manager, Provisioning Manager, Performance Manager y OnCommand Insight. Esto nos permite contar con un solo conjunto de herramientas que funcionan en todos nuestros sistemas de almacenamiento de NetApp para simplificar la gestión, acelerar el aprovisionamiento e identificar problemas de rendimiento. OnCommand Insight (antes conocido como SANscreen® de NetApp) nos ofrece una vista consolidada de todo nuestro entorno heterogéneo de almacenamiento en términos de capacidad, conectividad, configuraciones y rendimiento. También emite alertas por fallas de componentes, lo que nos permite resolver los problemas antes de que los componentes redundantes fallen también. Hacer más con menos Ya mencioné los beneficios considerables en materia de eficiencia y escalabilidad que obtuvimos gracias a la implementación de WestlawNext y otros servicios con la infraestructura que describí. El uso compartido de infraestructura en el sistema de "back-end" nos permite satisfacer con eficiencia los picos de demanda de varias aplicaciones mediante la asignación de recursos donde se los necesita y la minimización de recursos inactivos. La virtualización del sistema de "front-end" nos ha permitido reducir la cantidad de servidores y otra infraestructura asociada. Todas nuestras iniciativas nos han permitido evitar la construcción de otro centro de datos hasta el momento. Las tecnologías de almacenamiento de NetApp, incluidas las copias Snapshot, SnapRestore, Flash Cache y el conjunto completo de capacidades de gestión, nos ayudan a optimizar el uso del almacenamiento y eliminar los cuellos de botella. Para Thomson Reuters, la relación global con NetApp es tan importante para nuestro éxito como la tecnología de NetApp. De todos los proveedores con los que trabajamos, NetApp es uno de apenas dos socios que consideramos socios tecnológicos estratégicos. Los problemas se resuelven de inmediato y NetApp siempre está dispuesto a ayudarnos con iniciativas tecnológicas clave como WestlawNext. NetApp ha colaborado estrechamente con nosotros para optimizar el rendimiento y ayudarnos a aprovechar rápidamente las nuevas funcionalidades de almacenamiento. ¿Tiene alguna opinión sobre el caso práctico de Thomson Reuters?Realice preguntas, intercambie ideas y comparta sus pensamientos en línea en las comunidades de NetApp. Tech OnTap Visite para suscribirse hoy mismo. | |
![]() | ![]() |
| Contacto | Métodos de compra | Comentarios | Empleos | Suscripciones | Política de privacidad | © 2011 NetApp |