NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
Caso práctico: Thomson Reuters

En Thomson Reuters, nuestra misión es satisfacer las necesidades informativas de las empresas y los profesionales de una amplia gama de especialidades, por lo que la tecnología de la información es esencial para todo lo que hacemos. Las bases de nuestro enfoque actual de TI se sentaron hace más de 10 años, cuando Westlaw, nuestro servicio de investigaciones legales en línea, empezó a afrontar desafíos de estabilidad.

En ese momento, antes de las crisis de las empresas punto com, Westlaw era todavía una plataforma heredada basada en entorno mainframe, lo que nos hizo perder a ingenieros de software talentosos que querían trabajar con tecnologías más nuevas. Me encomendaron la creación de una infraestructura nueva y abierta para Westlaw que también pudiera dar soporte al resto de nuestras áreas de información. La creación de una infraestructura compartida con componentes básicos estándar resultó ser un pedido muy adelantado para su tiempo.

Esta directiva simple nos encaminó hacia una evolución constante de la TI a lo largo de los años y, más recientemente, contribuyó al lanzamiento exitoso de un servicio de investigación legal de última generación totalmente nuevo: WestlawNext. Nuestra infraestructura nos permitió agregar soporte para WestlawNext al tiempo que ahorramos unos $65 millones en costos de centros de datos nuevos, con un consumo de energía 25% menor y disponibilidad todo el día, todos los días del año.

WestlawNext tiene la capacidad de buscar en una cantidad de datos 50 veces mayor (5000 millones de documentos) que la generación anterior y genera los resultados el doble de rápido.

En este artículo, quiero destacar algunos de los elementos importantes de esta infraestructura, como los componentes básicos, nuestra arquitectura central de búsqueda y nuestro sistema "front-end" virtualizado. NetApp y los servicios profesionales de NetApp fueron socios invaluables en esta iniciativa, por lo que también trataré de reconocer el mérito como corresponde.

Una infraestructura compartida de TI para la búsqueda

La clave del éxito de WestlawNext y de todos los productos de Thomson Reuters es la capacidad de hacer búsquedas en una cantidad enorme de datos con mucha rapidez y precisión absoluta. Si dos personas hacen la misma búsqueda al mismo tiempo, deberían obtener exactamente los mismos resultados.

Gracias a las mejoras en los métodos de búsqueda de WestlawNext, los usuarios pueden pedir lo que necesitan en idioma corriente, sin necesidad de saber cómo armar una consulta formal. Como resultado, una consulta que generaba una sola búsqueda dos o tres años atrás ahora produce 40 o más búsquedas de "back-end", y nuestra infraestructura todavía tiene la capacidad de ampliarse para satisfacer esta carga, lo que es realmente asombroso. Ha superado por mucho los objetivos originales. Una búsqueda típica tarda apenas 2,5 segundos en devolver datos al cliente.

Los elementos clave de nuestra infraestructura incluyen:

  • Componentes básicos estándar
  • Una arquitectura de búsqueda tipo nube
  • Sistema "front-end" web virtualizado
  • Replicación para la recuperación tras desastres

Componentes básicos estándar
Nuestra infraestructura está formada por componentes básicos estándar. Tenemos entre 25.000 y 30.000 servidores x86 en nuestros centros de datos, la mayoría con configuraciones de 2 o 4 CPU y respaldados por almacenamiento de NetApp®. Nuestra infraestructura de red es casi toda de Ethernet de 10 Gigabits con switches de las familias Cisco 6500 y Cisco Nexus 5000 y 7000. Usamos estos componentes básicos en las configuraciones de "front-end" y "back-end".

Indicadores clave de Thomson Reuters
Más de 25,0000 servidores
Almacenamiento NetApp con Flash Cache
Cientos de clústeres RAC de Oracle
Más de 30 aplicaciones que utilizan la infraestructura de búsquedas Novus, construida sobre Linux
"Front-end" virtualizado con VMware
Evitó el gasto de $65 millones para construir un nuevo centro de datos
Reducción del consumo de energía en un 25%
Búsquedas en 50 veces más datos (5 mil millones de documentos) en la mitad del tiempo

 

Figura 1) Logros sobresalientes de WestlawNext y la transformación de la TI de Thomson Reuters

Novus: infraestructura tipo nube para las búsquedas
Nuestra arquitectura Novus, patentada en 2006, es la base de todas nuestras operaciones de búsqueda. La arquitectura Novus ofrece una plataforma única que admite servicios en línea de los cuatro grupos de mercado de Thomson, incluidos WestlawNext y Checkpoint®, nuestro sistema de investigación impositiva y contable. En total, más de 30 aplicaciones usan la arquitectura Novus.

El sistema Novus es una arquitectura distribuida de búsqueda que usa miles de servidores SUSE Linux® que ejecutan nuestro software de propiedad exclusiva. Cada servidor es responsable de una parte del índice de contenido general, que cabe en la memoria del servidor por lo que puede consultarse muy rápidamente. Cuando se ejecuta una búsqueda, se consultan miles de máquinas al mismo tiempo. Los resultados se envían a un controlador, que los ordena, los agrupa, los clasifica y envía esta información a la aplicación solicitante. De esta manera, podemos obtener un rendimiento de búsqueda de menos de un segundo.

Luego la aplicación decide si desea consultar los documentos identificados en la búsqueda. Los almacenes de contenido no se llegan a consultar hasta que se solicita un documento. El contenido en sí se almacena en cientos de clusters de base de datos Oracle® RAC, generalmente con cuatro nodos por cluster. Cada cluster tiene un subconjunto del contenido total.

Sé que el término "nube" significa algo diferente para cada persona, pero Novus está diseñado para proporcionar la flexibilidad que suele caracterizar a la infraestructura en nube, aunque la infraestructura se diseñó antes de que se popularizara este término. Todos los servidores del entorno de Novus pueden reasignarse en tiempo real para adoptar otra función. Cuando diseñamos esto, nos quisimos asegurar de que si había un evento pico, podríamos reasignar recursos muy rápidamente para, por ejemplo, convertir un servidor de base de datos en un servidor de búsqueda.

Cuando instalamos código en Novus, todo el código se instala en todos los servidores para todas las funciones. Por esto, lo único que tenemos que hacer es un simple ajuste, algo así como decirle al servidor A que ya no es un servidor de búsqueda, sino que es un servidor de carga.

Si WestlawNext está recibiendo muchas consultas, podemos asignarle más recursos específicamente, lo mismo con Checkpoint o con cualquier otra aplicación que necesite más recursos. No hace falta reiniciar los servidores, basta con que carguen en memoria los índices correspondientes del almacenamiento de NetApp y estarán listos para la nueva función. Varios conjuntos de servidores pueden asignarse al mismo conjunto de índices para aumentar el paralelismo y que Novus se pueda seguir ampliando.

Esta capacidad dinámica también nos permite integrar la redundancia en el entorno y garantizar la precisión de los resultados. Siempre tenemos otros servidores inactivos disponibles. Si pasados apenas unos pocos milisegundos de haber enviado una solicitud no recibimos un resultado de un servidor, hacemos algunas pruebas rápidas del servidor. Si no responde, funciona lento o tiene algún otro problema, otro servidor se asigna automáticamente para cumplir esa función. Este servidor cargará en memoria el índice correspondiente y atenderá la solicitud.

El resultado final es que un servidor puede fallar y el usuario aún así recibirá un resultado preciso sin omisiones y con apenas unos pocos segundos de demora. El usuario no tiene que volver a enviar la solicitud; la recuperación sucede automáticamente sin intervención del administrador. Para el contenido de Novus en sí, el uso de Oracle RAC aporta redundancia. Si un servidor RAC falla, otro nodo del cluster cumplirá su función. Si un cluster RAC está recibiendo muchas consultas, podemos agregar más nodos de manera dinámica para adaptarnos a la carga.

Sistema "front-end" virtualizado
Para todo el sistema "front-end" (todo lo que está fuera de Novus) usamos un entorno mucho más típico compuesto por servidores web y varios servidores de aplicaciones. Además de acceder a Novus para las búsquedas, el nivel de aplicaciones también accede a diversos datos que no vienen al caso, como bases de datos de seguridad, información de usuarios, bases de datos de facturación, datos del sistema de información de gestión (MIS) y demás datos que necesita una aplicación normal.

Gran parte del entorno "front-end" se ha virtualizado con VMware®. La mayoría de los servidores web y los servidores de aplicaciones se ejecutan en máquinas virtuales. VMware nos permite hacer en el sistema "front-end" el mismo tipo de asignación dinámica de recursos que hacemos en Novus. Podemos optimizar la cantidad de servidores web y servidores de aplicaciones para cada aplicación según sea necesario.

VMware también nos permite operar sin interrupciones. HA de VMware ofrece protección contra fallas de máquinas virtuales y vMotion™ permite hacer mantenimiento y otras operaciones sin tiempo de inactividad ni pérdida de trabajo en proceso, algo que antes era imposible. Antes de la virtualización, si tenía 100 usuarios en un servidor que necesitaba mantenimiento, debía detener sus actividades, desconectarlos y pedirles que volvieran a iniciar sesión (o hacer algún truco de magia de programación, lo que resultaba casi imposible).

Con VMware, podemos hacer tantas tareas de mantenimiento como sea necesario durante el día porque simplemente podemos mover las VM en ejecución a un conjunto auxiliar de servidores, para luego hacer las tareas de mantenimiento necesarias en los servidores originales.

Recuperación tras desastres
Ya expliqué cómo proporcionamos redundancia dentro del centro de datos, pero me contuve de hablar sobre la recuperación tras desastres (DR) para no complicar las cosas. En condiciones normales de funcionamiento, siempre tenemos dos centros de datos ejecutándose con una infraestructura muy similar y datos idénticos. Si perdemos un centro de datos en ejecución debido a un desastre, el otro centro de datos en ejecución puede ampliar sus operaciones para admitir la carga adicional de búsqueda.

Usamos la replicación para mantener sincronizados nuestros centros de datos. Hemos desarrollado nuestros propios mecanismos de replicación para admitir la replicación de los índices de Novus y asegurarnos de que estén perfectamente sincronizados. Los almacenes de contenido de nuestras bases de datos de Oracle RAC se replican con Oracle DataGuard.

NetApp cambia las reglas del juego

El almacenamiento de NetApp admite la arquitectura de Novus (índices y almacenes de contenido de Oracle RAC), así como el entorno "front-end" de VMware. Todos los índices alojados en nuestros servidores Linux y todo el contenido almacenado en Oracle RAC se guardan en almacenamiento NAS de NetApp, al que se accede mediante NFS. Novus simplemente no podría funcionar si miles de servidores no pudieran compartir el acceso a nuestros sistemas de almacenamiento al mismo tiempo, con la capacidad de cambiar de manera dinámica qué servidor accede a qué sistema de almacenamiento sobre la marcha. El almacenamiento de NetApp realmente cambió las reglas del juego cuando lo implementamos por primera vez en 2002, y sigue siendo una parte esencial de nuestra solución actual.

Para satisfacer los requisitos de escalabilidad y rendimiento de WestlawNext, hicimos algunas mejoras recientes en la infraestructura. Agregamos Flash Cache a los sistemas clave de NetApp. Específicamente, empezamos a usar esta tecnología en los sistemas de NetApp que proporcionan almacenamiento para un solo cluster de Oracle RAC. Estos clusters suelen tener requisitos de baja capacidad y alto rendimiento, por lo que Flash Cache ayuda a mantener un rendimiento alto sin tener que agregar discos físicos ni desperdiciar capacidad para obtener el rendimiento necesario. También empezamos a usar Flash Cache en los sistemas de almacenamiento compartido que proporcionan los índices y otros datos a nuestros clientes de Linux; las pruebas preliminares indican que tendrá un impacto igual de importante aquí.

Como es de esperarse, agregamos contenido nuevo todo el tiempo, lo que significa que debemos rearmar los índices y retirar el contenido nuevo y los índices asociados mientras mantenemos todo sincronizado. Si se produce un problema y tenemos que revertir a un estado anterior, esto debe hacerse lo más rápido posible. La tecnología SnapRestore® de NetApp es por lejos la mejor solución que puede lograr esto.

Antes de hacer una carga de contenido, creamos una copia Snapshot™. Entonces, si tenemos que revertir a un estado anterior por algún motivo, simplemente podemos ejecutar una operación de SnapRestore para que nuestro almacenamiento (en un centro de datos y luego en otro) vuelva al estado en el que estaba antes de iniciar la carga. (En algunos casos, para las bases de datos, es posible que se deban repetir los registros).

Usamos la deduplicación de NetApp en nuestro entorno de VMware para eliminar la duplicación generada por tener una gran cantidad de VM casi idénticas. Una sola división tiene más de 9000 VM de VMware en ejecución en almacenamiento de NetApp; hemos podido ahorrar más de 160 TB de espacio de almacenamiento primario gracias a la deduplicación.

Para gestionar nuestro entorno, usamos el conjunto completo de productos de gestión OnCommand™ de NetApp, incluidos Operations Manager, Provisioning Manager, Performance Manager y OnCommand Insight. Esto nos permite contar con un solo conjunto de herramientas que funcionan en todos nuestros sistemas de almacenamiento de NetApp para simplificar la gestión, acelerar el aprovisionamiento e identificar problemas de rendimiento. OnCommand Insight (antes conocido como SANscreen® de NetApp) nos ofrece una vista consolidada de todo nuestro entorno heterogéneo de almacenamiento en términos de capacidad, conectividad, configuraciones y rendimiento. También emite alertas por fallas de componentes, lo que nos permite resolver los problemas antes de que los componentes redundantes fallen también.

Hacer más con menos

Ya mencioné los beneficios considerables en materia de eficiencia y escalabilidad que obtuvimos gracias a la implementación de WestlawNext y otros servicios con la infraestructura que describí. El uso compartido de infraestructura en el sistema de "back-end" nos permite satisfacer con eficiencia los picos de demanda de varias aplicaciones mediante la asignación de recursos donde se los necesita y la minimización de recursos inactivos. La virtualización del sistema de "front-end" nos ha permitido reducir la cantidad de servidores y otra infraestructura asociada. Todas nuestras iniciativas nos han permitido evitar la construcción de otro centro de datos hasta el momento. Las tecnologías de almacenamiento de NetApp, incluidas las copias Snapshot, SnapRestore, Flash Cache y el conjunto completo de capacidades de gestión, nos ayudan a optimizar el uso del almacenamiento y eliminar los cuellos de botella.

Para Thomson Reuters, la relación global con NetApp es tan importante para nuestro éxito como la tecnología de NetApp. De todos los proveedores con los que trabajamos, NetApp es uno de apenas dos socios que consideramos socios tecnológicos estratégicos. Los problemas se resuelven de inmediato y NetApp siempre está dispuesto a ayudarnos con iniciativas tecnológicas clave como WestlawNext. NetApp ha colaborado estrechamente con nosotros para optimizar el rendimiento y ayudarnos a aprovechar rápidamente las nuevas funcionalidades de almacenamiento.

 ¿Tiene alguna opinión sobre el caso práctico de Thomson Reuters?

Realice preguntas, intercambie ideas y comparta sus pensamientos en línea en las comunidades de NetApp.

Por Mark Bluhm, Vicepresidente sénior y director de asuntos técnicos (CTO) de Shared Services, División profesional de Thomson Reuters

Mark Bluhm es vicepresidente sénior y director tecnológico de Shared Services, y supervisa las operaciones y estrategias del centro de datos para la división profesional de Thomson Reuters.

Mark tiene más de 19 años de experiencia en la empresa; comenzó su carrera en la entonces llamada West en 1991 como ingeniero de software. Desde ese entonces, Mark ha ocupado varios cargos de liderazgo tecnológico, como arquitecto en jefe del departamento legal y regulatorio de Thomson. De hecho, fue uno de los principales involucrados en la invención de la tecnología Novus y es el principal titular de la patente de esta solución empresarial propiedad de TRGR. Después de la adquisición de Reuters por parte de Thomson en 2008, Mark participó en la fusión de las infraestructuras de ambas empresas. En los últimos tiempos, fue director tecnológico de los departamentos legal y de tecnología de desarrollo de clientes.

Mark obtuvo su título de grado y su título de maestría en matemática y ciencias de la computación en University of South Dakota, y su doctorado en ciencias de la computación en Washington University.


Tech OnTap
Suscríbase ya
Tech OnTap proporciona novedades de TI mensualmente, además de gozar de acceso exclusivo a las mejores prácticas, sugerencias y herramientas del mundo real, entrevistas a ingenieros detrás de escena, demostraciones, opiniones de colegas y mucho más.

Visite para suscribirse hoy mismo.

Explore
Explore
Acerca de Thomson Reuters

Thomson Reuters es el líder mundial en información inteligente para empresas y profesionales. La empresa combina la experiencia en el sector con tecnología innovadora para proporcionar información esencial a los líderes encargados de la toma de decisiones de los mercados financiero, legal, impositivo y contable, científico, de atención médica y de medios de comunicación, con el respaldo de la organización de noticias más confiable del mundo. Con sede central en Nueva York y sedes importantes en Londres, Inglaterra y Eagan, Minnesota, Thomson Reuters tiene más de 55.000 empleados en más de 100 países y declara ingresos de USD 13.100 millones (2010).

Explore
TRUSTe
Contacto   |   Métodos de compra   |   Comentarios   |   Empleos  |   Suscripciones   |   Política de privacidad   |   © 2011 NetApp