NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
NetApp and Red Hat Collaborate on pNFS
Pranoop Erasani
Director Técnico, NFS
Justin Parisi
Ingeniero Técnico de Marketing

El acceso a datos compartidos es crítico para el rendimiento de diversas aplicaciones de ingeniería, científicas, empresariales y financieras. NFS, el estándar más comúnmente utilizado para el acceso a datos compartidos, puede convertirse en un cuello de botella en clústeres informáticos a gran escala, lo cual puede superar a los servidores de archivos que son el punto de acceso único para todos los archivos en un sistema de archivos compartido.

 

La mayoría de las soluciones disponibles para proporcionar un alto rendimiento y un acceso a los datos compartidos son más o menos de propiedad y no han logrado obtener el tipo de compatibilidad de sistema heterogéneo y la amplia adopción que han logrado los protocolos estándar como NFS.

 

El estándar paralelo de NFS (pNFS), una subfunción de la versión 4.1 de NFS de la especificación del protocolo (RFC 5661), ofrece respuesta al embotellamiento de servidor único y ofrece la gran promesa de convertirse en una solución estandarizada para el acceso a datos en paralelo. En este artículo, explicaré cómo funciona pNFS, hablaré sobre los esfuerzos que están haciendo NetApp y Red Hat para hacer avanzar pNFS y describiré cómo se implanta pNFS en Clustered Data ONTAP® de NetApp®.

¿Qué es pNFS?

El protocolo pNFS proporciona a los clientes un acceso directo a archivos divididos entre dos o más servidores de datos. Al acceder a múltiples servidores de datos en paralelo, los clientes logran una aceleración de I/O significativa. El protocolo pNFS proporciona un escalado de rendimiento correcto tanto si se basa en cada archivo como en cada cliente, sin sacrificar la compatibilidad con versiones anteriores del protocolo NFS estándar; los clientes sin la extensión pNFS todavía pueden acceder a los datos.

 

Arquitectura pNFS y protocolos básicos

 

La arquitectura pNFS consiste en tres componentes principales:

 

  • El servidor de metadatos se encarga de todo el tráfico que no es de datos. Es responsable de mantener los metadatos que describen dónde y cómo se almacena cada archivo.
  • Los servidores de datos almacenan los archivos y responden directamente a las solicitudes de lectura y escritura del cliente. Los datos de archivo pueden estar divididos entre diversos servidores de datos.
  • Uno o varios clientes pueden acceder a los servidores de datos directamente en función de la información en los metadatos que se reciba del servidor de metadatos.

 

Se utilizan tres tipos de protocolo entre los clientes, el servidor de metadatos y los servidores de datos:

 

  • Se utiliza un protocolo de control para sincronizar el servidor de metadatos y los servidores de datos. Este no está definido por la especificación de pNFS y varía según cada proveedor.
  • El protocolo pNFS se utiliza entre los clientes y el servidor de metadatos. Esto es esencialmente NFSv4 con algunas extensiones específicas de pNFS. Se utiliza para recuperar y manipular distribuciones que contienen los metadatos que describen la ubicación y el protocolo de acceso del almacenamiento necesarios para acceder a los archivos almacenados en múltiples servidores de datos.
  • Los clientes utilizan un conjunto de protocolos de acceso al almacenamiento para acceder directamente a los datos. El estándar pNFS actualmente define tres categorías de protocolos de almacenamiento: basado en archivos (RFC5661), basado en bloques (RFC5663) y basado en objetos (RFC5664). Clustered Data ONTAP actualmente es compatible con el protocolo de almacenamiento basado en archivos y utiliza NFSv4.1 para acceder a los servidores de datos.

 

 

< Elementos de pNFS. Los clientes solicitan la distribución al servidor de metadatos (protocolo pNFS) y, a continuación, acceden a los servidores de datos directamente (protocolo de acceso al almacenamiento).

Figura 1) Elementos de pNFS. Los clientes solicitan la distribución al servidor de metadatos (protocolo pNFS) y, a continuación, acceden a los servidores de datos directamente (protocolo de acceso al almacenamiento).

 

 

Para acceder al archivo, un cliente se pone en contacto con el servidor de metadatos para abrir el archivo y solicitar la distribución de este. Una vez que el cliente recibe la distribución del archivo, utiliza esta información para realizar un I/O directamente de y a los servidores de datos en paralelo, utilizando el protocolo de acceso de almacenamiento adecuado sin volver a involucrar al servidor de metadatos. Los clientes de pNFS almacenan en caché la distribución hasta que han acabado con las operaciones de I/O en paralelo. Los servidores de pNFS tienen el derecho de revocar la distribución del archivo si el servidor no puede garantizar el acceso en paralelo a los servidores. Además, pNFS no modifica el mecanismo actual disponible en el servidor NFS para el acceso a los metadatos.

NetApp y Red Hat se unen para pNFS

Una solución de pNFS requiere que funcionen tanto los componentes de cliente como los de servidor. NetApp y Red Hat han colaborado ampliamente con la comunidad de subida de contenidos para proporcionar la primera oferta basada en estándares de pNFS completa.

 

NetApp ofrece respuesta a los retos del escalado al combinar el clustering del almacenamiento y pNFS. El almacenamiento FAS y V-Series de NetApp con Clustered Data ONTAP 8.1 o posteriores, puede escalar desde tan solo unos terabytes de datos a más de 69 petabytes, y todo ello puede gestionarse desde una única entidad de almacenamiento, lo cual simplifica la gestión de un entorno pNFS y ayuda a eliminar los tiempos de inactividad previstos e imprevistos.

 

Con el primer cliente pNFS del mercado y completamente compatible, ofrecido en Red Hat Enterprise Linux®, puede empezar a planificar y diseñar soluciones del sistema de archivos de próxima generación y escalables basadas en pNFS. Las cargas de trabajo de las aplicaciones pueden aprovechar completamente pNFS sin modificaciones, lo cual permite una transición perfecta para las aplicaciones existentes.

pNFS y Clustered Data ONTAP

NetApp implantó pNFS empezando por Clustered Data ONTAP 8.1. (No existe en las implantaciones de 7-Mode ni de Data ONTAP 7G). pNFS implantado en Clustered Data ONTAP ofrece diversas ventajas:

 

  • Infraestructura más simple. La infraestructura general de pNFS es más sencilla en comparación con otros sistemas de archivos en paralelo como Lustre y GPFS, los cuales requieren muchos servidores dedicados además del almacenamiento.
  • Capacidad de gestión. Normalmente, pNFS incluye múltiples servidores de archivo que deben ser gestionados independientemente. Clustered Data ONTAP le permite gestionar todos los componentes pNFS del lado del servidor como un único sistema.
  • Operaciones no disruptivas. Una instalación pNFS en un clúster de NetApp se beneficia de las operaciones no disruptivas para el mantenimiento y el equilibrado de carga, como la recuperación tras fallos de almacenamiento, migraciones LIF y movimiento de volúmenes no disruptivo, como cualquier otra carga de trabajo.
  • Todos los nodos pueden actuar como servidores de metadatos. En la implantación de Clustered Data ONTAP, cada nodo en el clúster de almacenamiento puede actuar como servidor de metadatos y como servidor de datos. Esto elimina el posible embotellamiento que se crea al tener un único servidor de metadatos y ayuda en la distribución de las operaciones de metadatos en el clúster.

 

pNFS en Data ONTAP comparado con NFS. Cada nodo puede servir como servidor de metadatos y servidor de datos.

Figura 2) pNFS en Data ONTAP comparado con NFS. Cada nodo puede servir como servidor de metadatos y servidor de datos.

 

 

Para entender cómo funciona pNFS con Clustered Data ONTAP, supongamos que el cliente ha montado un sistema de archivos pNFS desde un nodo en un clúster. Para acceder a un archivo, envía una solicitud de metadatos a ese nodo. La implantación de pNFS recoge y devuelve la información que incluye la ubicación, la distribución del archivo y la información de red necesaria para llegar a la ubicación. El cliente utiliza la información para acceder a los datos directamente desde el nodo o los nodos en los que se encuentran. Al proporcionar una ruta directa al volumen, pNFS ayuda a las aplicaciones a lograr un mayor rendimiento y una menor latencia.

 

pNFS se integra perfectamente con las operaciones no disruptivas de Clustered Data ONTAP como la migración LIF, la recuperación tras fallos de almacenamiento y el movimiento de volúmenes. Cuando se da una de estas operaciones, el cliente pNFS y el servidor negocian automáticamente la nueva ruta de I/O directa al servidor, lo cual ayuda a mantener el mismo rendimiento, todo ello sin interrupciones para la aplicación. Esto supone una gran ventaja para los administradores del almacenamiento, ya que no tienen que aprovisionar explícitamente rutas de red a los sistemas de archivos cuando realizan las operaciones de mantenimiento en el clúster. Además, pNFS con Clustered Data ONTAP no solo ayuda con el rendimiento, también simplifica los flujos de trabajo administrativos durante las operaciones de mantenimiento. Cuando se aprovisionan y ponen en funcionamiento grandes clústeres, esto se convierte en una necesidad.

 

Sin pNFS, tanto las rutas de metadatos como las de datos pasan a ser más o menos estáticas. Con pNFS, el servicio de metadatos queda distribuido entre múltiples nodos, mientras que las rutas a los datos van directas a la interfaz de red del nodo que almacena el archivo. Cuando se mueven datos, las rutas de los datos se adaptan automáticamente para mantener un rendimiento óptimo.

Figura 3) Sin pNFS, tanto las rutas de metadatos como las de datos pasan a ser más o menos estáticas. Con pNFS, el servicio de metadatos queda distribuido entre múltiples nodos, mientras que las rutas a los datos van directas a la interfaz de red del nodo que almacena el archivo. Cuando se mueven datos, las rutas de los datos se adaptan automáticamente para mantener un rendimiento óptimo.

 

 

Mejores prácticas

 

Preste atención a algunas de las mejores prácticas que ayudan a proporcionar el mejor rendimiento de pNFS:

 

  • Consulte la Matriz de interoperabilidad de NetApp para obtener la información de compatibilidad más reciente con los clientes NFSv4.1 y pNFS (requiere el acceso al sitio de soporte de NetApp).
  • Cada nodo de clúster compatible con pNFS debe configurarse con al menos una interfaz lógica (LIF) para que los clientes pNFS puedan acceder a los volúmenes almacenados en ese nodo directamente.
  • En cargas de trabajo con un gran volumen de metadatos, los clientes pNFS deben configurarse para que las cantidades se distribuyan entre todos los nodos del clúster, de modo que todos puedan actuar como servidores de metadatos. Esto puede conseguirse al utilizar un servidor de nombres de dominio (DNS) externo y por turnos o a través del equilibrado de carga DNS integrado en Clustered Data ONTAP.

 

Si desea más información sobre la puesta en funcionamiento de pNFS en almacenamiento de NetApp, consulte TR-4063.

Cliente pNFS de Red Hat

El cliente pNFS de Red Hat se lanzó por primera vez en el kernel Red Hat Enterprise Linux (RHEL) versión 6.2 en 2011. RHEL 6.2 y RHEL 6.3 se etiquetaron ambas como versiones de «vista previa tecnológica» de pNFS.

 

RHEL 6.4, publicado en febrero de 2013, incluía la primera versión de disponibilidad general de pNFS. Si desea información más completa sobre el uso de clientes de Red Hat con almacenamiento de NetApp en NFS o pNFS, consulte TR-3183. (Este informe técnico se está revisando actualmente y es posible que no esté disponible inmediatamente cuando se publique el artículo. Asegúrese de volver a comprobarlo de nuevo).

Casos prácticos de pNFS

Además de su aplicación obvia para aplicaciones de ciencia altamente en paralelo y de ingeniería, las funciones únicas de pNFS lo convierten en la opción idónea en una gran variedad de casos prácticos empresariales.

 

Aplicaciones clave

 

Por definición, las aplicaciones vitales para el negocio requieren un nivel de servicio superior. El ancho de banda del almacenamiento y la capacidad deben crecer perfectamente con los requisitos del servidor. Como los volúmenes de almacenamiento de NetApp se migran de forma transparente a controladoras más potentes en el clúster de NetApp, el cliente pNFS de Red Hat Enterprise Linux sigue automáticamente el movimiento de los datos, se adapta automáticamente y vuelve a optimizar la ruta de los datos. El resultado neto es un tiempo de inactividad casi nulo sin necesidad de reconfigurar servidores ni aplicaciones.

 

Soluciones de almacenamiento multi-tenancy

 

Tener un acceso a los datos en paralelo significa que las cargas de trabajo heterogéneas de multi-tenancy se benefician directamente de pNFS. Los datos residen en el clúster de NetApp y no están ligados a una controladora de NetApp específica. Con pNFS, los servidores Red Hat Enterprise Linux encuentran la ruta óptima a los datos y se ajustan automáticamente para un rendimiento óptimo.

 

Clientes y cargas de trabajo mixtos

 

NFSv4.1 y pNFS pueden proporcionar flexibilidad en el montaje del sistema de archivos desde cualquier espacio de nombres del clúster. Las aplicaciones en clúster pueden montarse en pNFS, mientras que las aplicaciones antiguas todavía pueden montarse en NFSv3. Los sistemas de archivos que se exportan desde el almacenamiento pueden tener clientes montados en distintos tipos de NFS para poder coexistir sin tener que realizar cambios significativos en las aplicaciones que acceden a los datos. Este nivel de flexibilidad reduce la sobrecarga de un cambio frecuente de administración.

 

Entornos de virtualización

 

Los hipervisores y los equipos virtuales que utilizan el cliente pNFS de Red Hat Enterprise Linux pueden mantener múltiples conexiones por cada sesión, lo cual reparte la carga entre múltiples interfaces de red. Piense en ello como una multivía para NFS, sin necesidad de controladoras multivía ni configuraciones aparte.

Conclusión

NetApp ha sido uno de los principales impulsores tanto de NFSv4.1 como de pNFS, compartiendo los esfuerzos del grupo de trabajo. Además, NetApp ha escrito y editado una parte significativa de la especificación de NFSv4.1, lo cual se alinea con nuestro compromiso para abordar los problemas del almacenamiento con el uso de estándares del sector.

 

Con la disponibilidad general reciente del cliente de pNFS con el lanzamiento de RHEL 6.4, ahora puede poner en funcionamiento pNFS para pruebas y/o producción con una combinación de clientes de Red Hat y Clustered Data ONTAP de NetApp.

¿Quiere compartir su opinión?

Pranoop es el arquitecto líder de NFS en la organización de Ingeniería de Tecnología de Protocolos de NetApp, donde lidera el desarrollo del protocolo NFS para Data ONTAP. Ha sido clave en el diseño de pNFS para Clustered Data ONTAP. Pranoop es un férreo defensor del aprovechamiento de NFSv4.1/pNFS en sistemas de clúster. Ha participado en diversos debates relacionados con el estándar pNFS IETF e interviene con frecuencia en charlas en eventos de interoperabilidad NFS. Actúa como consejero técnico clave para el marketing técnico y la gestión de producto para puestas en funcionamiento de clientes continuas y soluciones de software de almacenamiento.

Justin se encuentra en RTP y ha pasado los últimos 5 años en el Soporte Global de NetApp como ingeniero de soporte técnico y como ingeniero de escalado de resolución de problemas críticos. Se centra en Clustered Data ONTAP y ha desarrollado el material del curso de resolución de problemas, así como diversos artículos de la base de conocimientos. Su interés abarca una amplia gama de áreas que incluyen CIFS, NFS, SNMP, administrador de sistemas OnCommand®, Unified Manager, SnapDrive® y SnapManager®, así como Microsoft® Exchange, SQL Server®, Active Directory®, LDAP y más; lo cual le convierte en una especie de navaja suiza de conocimientos de NetApp.

Explore
Explore
Más información sobre pNFS

¿Desea obtener más información sobre pNFS y cómo puede ponerlo en funcionamiento para acelerar su entorno de TI? Consulte los siguientes enlaces:

Explore
 
TRUSTe
Contacto   |   Cómo comprar   |   Comentarios   |   Trayectoria profesional  |   Suscripciones   |   Política de privacidad   |   © 2013 NetApp