NetApp Tech OnTap Logotipo de NetApp
NetApp Tech OnTap
     
El cluster FAS6200 proporciona un rendimiento excepcional de baja latencia
Dimitris Krekoukias
Ingeniero de Sistemas

El software Data ONTAP® 8 de NetApp® operando en Cluster-Mode es la única plataforma de almacenamiento de escalabilidad horizontal unificada del sector capaz de soportar tanto los protocolos NAS como SAN desde un mismo cluster. Otro artículo de esta edición de Tech OnTap® proporciona un caso práctico de puesta en marcha de Cluster-Mode por un proveedor cloud de rápido crecimiento. En artículos anteriores de Tech OnTap se han descrito las funciones y funcionalidades de Cluster-Mode, además de demostrarse su rendimiento y la escalabilidad en la prueba de referencia SPECsfs NFS. Un cluster de 24 sistemas FAS6240 logró 1,5 millones de operaciones/segundo SPECsfs2008_nfs.v3 de baja latencia.

Este rendimiento de servicio de archivos impresionante de Cluster-Mode naturalmente ha despertado la curiosidad del público con respecto a su rendimiento en cargas de trabajo orientadas a bloques. NetApp recientemente ofreció una prueba de referencia SPC-1 para un cluster FAS6240 de seis nodos en la cual demostró más de 250 000 SPC-1 IOPS™ (el cluster se creó mediante utilizando algunos de los mismos componentes que se utilizaron para nuestra prueba de SPECsfs). La combinación de IOPS elevados y la baja latencia hace que este resultado se encuentre entre los mejores resultados de SPC-1 ofrecidos por un sistema de almacenamiento basado en disco empresarial.

Descripción general de la arquitectura de PeakColo.

Figura 1) SPC-1 IOPS para un cluster FAS6240 de NetApp de seis nodos.

En este artículo hablaré acerca de la prueba de referencia SPC-1, incluida la importancia de la latencia. A continuación, profundizaré en los resultados de NetApp y de la competencia recientes en más detalle y hablaré acerca del almacenamiento en disco en comparación con el basado en Flash.

La prueba de referencia SPC-1

El Consejo de rendimiento del almacenamiento (Storage Performance Council, SPC) es un consorcio de proveedores de almacenamiento, integradores e instituciones académicas creado para definir, estandarizar y promover las pruebas de referencia en almacenamiento. La referencia SPC-1 del Consejo de rendimiento del almacenamiento es una prueba de referencia exigente, basada en bloques, estándar del sector y auditada que estresa los subsistemas de disco con una mezcla de I/O que incluye escritura, sobrescritura, escritura tras la lectura, lectura tras la escritura, puntos de sobrecarga y operaciones secuenciales y aleatorias. En general, un 60% de la carga de trabajo son escrituras, que la convierte en un gran reto para los sistemas de almacenamiento. El tamaño de I/O puede variar de pequeño a grande.

SPC-1 es posiblemente la mejor prueba de referencia disponible para ejemplificar la forma en la que las bases de datos estresan a los sistemas de almacenamiento. Cuando SPC desarrolló la prueba de referencia, estudió cómo accedían al almacenamiento una serie de aplicaciones y luego diseñó la carga de trabajo en función de estas mediciones. La mezcla de operaciones es representativa de una amplia gama de aplicaciones, aproximadamente la mitad de todas las aplicaciones comerciales.

Las pautas de acceso de SPC-1 resultan en puntos de sobrecarga que representan un porcentaje significativo de la carga de trabajo total. Dichos puntos de sobrecarga pueden almacenarse en caché de forma parcial (si la memoria caché es lo suficientemente grande) o pueden colocarse en SSD si el almacenamiento a prueba cuenta con un sistema de segmentación automatizada del almacenamiento (AST) que sea lo suficientemente granular e inteligente.

A pesar de que no hay ninguna prueba de referencia perfecta, SPC-1 probablemente es la mejor prueba de referencia estandarizada para la medición del rendimiento I/O por bloques aleatorios y para comparar los resultados entre proveedores. Si un sistema de almacenamiento tiene un buen rendimiento en SPC-1, normalmente su rendimiento será extremadamente bueno bajo cargas de trabajo de cambios dinámicos y susceptibles a la latencia, las aplicaciones de bases de datos en general y especialmente OLTP, además del correo electrónico y la virtualización. Los que tengan una curiosidad morbosa pueden leer todas las especificaciones.

SPC-1 no es una prueba de referencia de tipo rendimiento, si busca ver GB/seg. máximos, tendrá que mirar en otro lugar.

Interpretación de los resultados de la prueba de rendimiento

El truco con las pruebas de referencia es interpretar los resultados. Un único número de IOPS puede que no le indique todo el contexto. Existen diversos aspectos en los que centrarse cuando observa un informe de SPC-1.

Sostenibilidad. Todas las pruebas de referencia de SPC-1 incluyen una prueba de sostenibilidad que debe realizarse durante al menos ocho horas. Busque un IOPS sostenido con una coherencia elevada. El rendimiento nunca debería reducirse tras un lapso de tiempo, por lo que cuanto más larga se la prueba de sostenibilidad, mejor.

IOPS/disco. Esta es una medición sobre con qué eficiencia puede accionar el sistema de almacenamiento el hardware subyacente; 500 IOPS/disco es el doble de eficiente que 250 IOPS/disco. La capacidad para utilizar discos de forma más eficiente significa que se necesitan menos discos para lograr un nivel determinado de rendimiento, lo cual resulta en un menor coste y un espacio físico más reducido.

Tiempo de respuesta (latencia). El tiempo de respuesta en SPC-1 es una medición de cuánto tarda una transacción I/O media en completarse desde el punto de vista de la aplicación. Cuando más breve sea el tiempo de respuesta (respuesta más rápida), mejor. Es posible (pero no deseable) tener un IOPS alto con un tiempo de respuesta elevado. En las transacciones de base de datos, un tiempo de respuesta de 10 milisegundos se considera el máximo para un buen rendimiento en operaciones de lectura (las bases de datos de más de 20 milisegundos se consideran «caídas» por parte de proveedores como Microsoft), mientras que las escrituras deben reconocerse de forma todavía más rápida y las escrituras de registro de repetición deben reconocerse casi al instante.

Estos son algunos de los motivos por los cuales NetApp se centra en lograr resultados de baja latencia. Para obtener más información sobre IOPS y latencia, consulte mi reciente publicación en el blog.

Coste por OP. Esta es una medición sobre cuantos dólares debe gastar por cada operación. Básicamente, es el precio total del sistema dividido por el SPC-1 IOPS logrado. Tenga en cuenta, sin embargo, que algunos proveedores utilizan precios con descuento mientras que otros indican los precios de venta, lo cual puede sesgar los resultados.

Protección RAID. ¿Qué tipo de protección RAID se utilizó para la prueba? La mayoría de los resultados de SPC-1 utilizaron mirroring (RAID 10 o RAID 1+O) para eliminar la sobrecarga de paridad. En el mundo real esto significa que invertirá significativamente más en discos de lo que lo haría para una capacidad de uso similar con paridad única o doble paridad RAID.

El hardware general necesario. ¿Cuán compleja es la configuración de hardware? ¿Qué tipos de discos se han utilizado? ¿Podría poner en marcha este sistema en el mundo real o es un sistema diseñado para lograr un buen resultado de la prueba de referencia?

El resultado de SPC-1 de NetApp

El resultado de SPC-1 de NetApp se muestra en la Figura 1 anterior. Utilizamos un cluster de 6 nodos FAS6240 (3 pares de alta disponibilidad), cada uno con un módulo Flash Cache de 512 GB (estándar en el FAS6240) y un total de 432 unidades de disco (450 GB, 15.000 unidades SAS, 72 por controlador).

Flash Cache forma parte del Virtual Storage Tier (VST) de NetApp; los datos de lectura activos se promueven automáticamente a Flash. Cada controladora FAS6240 admite hasta 3 TB de Flash Cache, por lo que limitar cada nodo de cluster a una sola tarjeta de 512 GB incluida de forma estándar en el sistema es, sin duda, un desperdicio, si se compara con la configuración que podría ponerse en marcha en un centro de datos típico.

Del mismo modo, 72 unidades por controladora parece una cifra demasiado baja, ya que una sola controladora FAS6240 puede admitir hasta 1440 unidades. Para los discos, se utilizaron unidades SAS de 450 GB a 15 000 rpm. Es importante señalar que se utilizó la tecnología RAID-DP®, la implantación de RAID 6 de doble paridad de NetApp, en todas las pruebas. Esto es consistente con las prácticas del cliente estándar (RAID-DP es predeterminada en NetApp). La tabla 1 resume los resultados de la prueba de referencia con relación a las medidas descritas anteriormente.

Tabla 1) Rendimiento de NetApp en las mediciones SPC-1 clave.

Cluster de 6 nodos FAS6240 de NetApp
IOPS de SPC-1250 039,67
IOPS/Disco de SPC-1579
Tiempo de respuesta (latencia)3,35 ms
Coste por op6,69 $ (precio de venta)
Protección RAIDRAID-DP (doble paridad RAID 6)
Discos totales442
Controladoras6

Además, no observamos ninguna degradación en el rendimiento con el paso del tiempo mediante el mantenimiento de la prueba o repitiendo la prueba. Como podrá ver en la siguiente sección, estos resultados son muy buenos, especialmente en términos de IOPS con un tiempo de respuesta bajo (latencia).

Comparativa con otros resultados SPC-1 líderes

Realizamos un análisis de resultados SPC-1 líderes basados en disco con un umbral de tiempo de respuesta de aproximadamente 3 milisegundos. El análisis muestra que los resultados de SPC-1 de NetApp se encuentran entre los mejores de los sistemas basados en disco empresariales, gracias a la baja latencia de IOPS proporcionada. NetApp es capaz de lograr un rendimiento cercano al nivel de Flash a partir de una configuración basada principalmente en HDD.

El objetivo de tiempo de respuesta de 3 milisegundos es consistente con las necesidades de aplicaciones de base de datos exigentes de baja latencia como aquellas utilizadas por las entidades financieras. Para la gran mayoría de cargas de trabajo de base de datos, las latencias muy bajas de I/O mejoran en gran medida el funcionamiento de la base de datos.

Podrá ver un análisis más exhaustivo (con comentarios) en mi reciente publicación en el blog sobre estos resultados.

Los sistemas de almacenamiento que hemos comparado incluyen los siguientes (los hipervínculos a continuación enlazan con el informe de prueba de referencia SPC-1 completo de cada sistema de almacenamiento):

Tabla 2) Comparativa del cluster de NetApp con otros resultados líderes de SPC-1.

 Cluster FAS6240VSP de HDSHuawei S8100IBM SVC+V7000IBM SVC+DS8000HP 3Par
IOPS de SPC-1250 039,67269 506,69300 062,04520 043,99380 489,30450 212,66
Tiempo de respuesta (ms)3,35 ms5,85 ms7,08 ms7,39 ms7,64 ms13,67 ms
Precio de venta ($)1 672 602 $4 934 872 $2 311 568 $5 846 630 $13 672 255 $5 885 148 $
$/OP6,6918,317,7011,2435,9313,07
IOPS (~3 ms)*250 039,67
(3,35)
242 567,41
(3,23)
150 000,17
(3,60)
259 998,37
(2,71)
190 253,20
(2,96)
225 079,30
(3,29)
Núm. de controladoras68168+326+48
Núm. de discos4321 1521 1521 9202 0481 920
IOPS/disco579234260271186234
Tipo de RAIDRAID-DPRAID 10RAID 10RAID 10RAID 10RAID 10

*Estas cifras fueron obtenidas mediante la asignación de puntos de datos por cada resultado al más cercano a la respuesta de 3 ms de tiempo de respuesta y el IOPS informado en este punto. (Se muestra el tiempo de respuesta exacto por cada punto de datos).

SPC-1 IOPS e IOPS/disco y Coste/Op

La tabla 2 compara los distintos aspectos de los resultados de SPC-1 de los seis sistemas. Hay que reconocer que algunos de estos sistemas logran un SPC-1 IOPS bruto (primera fila) mejor que el cluster FAS6240 de NetApp. Sin embargo, NetApp logra más del doble de IOPS/disco en comparación con otros proveedores y también muestra el mejor resultado de valor por operación al precio de venta. Hemos normalizado el precio en la tabla para reflejar los precios de venta de todas las configuraciones (algunos proveedores indican precios en propuestas de SPC, por lo que realizar comparaciones sin normalizar precios es imposible).

IOPS a baja latencia

Cuando compara el rendimiento máximo de todos los sistemas a una latencia de 3 ms (mostrada en negrita en la tabla), solo un sistema, el IBM SVC con V7000, supera el sistema de NetApp pero es por solo un 4%. Este sistema es aproximadamente 3,5 veces más caro que el cluster de NetApp a precio de venta y es drásticamente más complicado con 8 motores de virtualización SVC, 16 sistemas V7000 (cada uno de los cuales consiste en 2 controladores SVC y 2 controladores RAID) y 1.920 unidades de disco 15KRPM de 146 GB. (Probablemente, este no es el tipo de disco que suele comprar en la actualidad). Esto supone una gran cantidad de configuración, gestión y potencia en comparación con el cluster de 6 controladores con 432 discos de NetApp.

Complejidad del sistema

En general, el cluster FAS6240 de NetApp es capaz de proporcionar grandes resultados con menos hardware y muchos menos discos que otros sistemas de almacenamiento mostrados y es la única cabina de almacenamiento que se ha probado con RAID de paridad doble en lugar de mirroring. Esto supone una gestión más sencilla, menos costes energéticos y gestión y una configuración más realista en general.

¿Qué pasa con Flash?

Aunque los resultados SPC-1 existen para los sistemas basados completamente n DRAM y Flash que demuestran un gran IOPS con un tiempo de respuesta muy bajo, estos sistemas por ahora no proporcionan la capacidad ni las funciones que normalmente necesitan las empresas según estos IOPS. Si requiere un IOPS muy elevado con una capacidad muy baja, las soluciones completamente Flash o DRAM son una opción a tener en cuenta pero las alternativas deben tenerse en consideración.

NetApp también ofrece opciones completamente Flash pero el futuro económico previsible sigue manteniéndose a favor de los sistemas de almacenamiento basados en disco o híbridos con Flash en cuanto los requisitos de capacidad superan unas pocas decenas de terabytes. La tabla 3 muestra la diferencia de costes con un cálculo aproximado que muestra los costes generales por TB de capacidad bruta.

Tabla 3) Coste por capacidad: cabinas DRAM y Flash en comparación con el cluster de NetApp.

 Cluster FAS6240 de NetAppKaminario K2-DTMS RAMSAN-630
Capacidad bruta 193 TB3,4 TB14 TB
Precio 1 672 602 $490 760 $419 292 $
Precio/TB8 666 $140 217 $29 949 $

Conclusión

Con este resultado de SPC-1, NetApp demuestra que Data ONTAP 8 Cluster-Mode proporciona un gran rendimiento tanto para cargas de trabajo SAN como NAS. Cluster-Mode proporciona:

  • Baja latencia (tiempo de respuesta) con un alto rendimiento.
  • Escalable de forma dinámica, clusters unificados para FC, iSCSI, NFS y CIFS.
  • Relación precio/rendimiento excelente.
  • Operaciones no disruptivas como el movimiento de datos entre nodos de cluster (incluido CIFS, que normalmente es casi imposible).
  • El conjunto de funciones de Data ONTAP incluye la optimización de escritura, concienciación de la aplicación, copias Snapshot™, deduplicación, compresión, replicación, thin provisioning, segmentación del almacenamiento virtual y más.
  • Capacidad para utilizar el mismo hardware para Cluster-Mode que para 7-Mode incluidas las plataformas V-Series que virtualizan cabinas de almacenamiento de otros proveedores.
 ¿Qué opina sobre Cluster-Mode?

Formule preguntas, intercambie ideas y comparta sus opiniones en las comunidades en línea de NetApp.

Por Dimitris Krekoukias, Ingeniero de Sistemas

Dimitris tiene tras de sí más de 17 años de experiencia en el sector tecnológico y una amplia experiencia con el almacenamiento, backup y recuperación de datos a gran escala, virtualización, sistemas paralelos masivos e informática de alto rendimiento. Desde que se unió a NetApp hace tres años, ha ejercido como experto en materia de competencia y rendimiento. Realiza publicaciones de blog de forma regular sobre el rendimiento y otros temas en www.recoverymonkey.org.

Editora de
Suscríbase ahora
Tech OnTap ofrece reportajes mensuales, acceso exclusivo a mejores prácticas, sugerencias y herramientas reales, entrevistas técnicas exclusivas, demostraciones, evaluaciones de expertos y muchas cosas más.

Visite Tech OnTap en la comunidad de NetApp y suscríbase hoy mismo.

En profundidad
En profundidad
Más información acerca de
Cluster-Mode

¿Desea más información acerca del funcionamiento de Data ONTAP 8
Cluster-Mode? Lea los siguientes artículos de Tech OnTap:



Más de este autor

¿Desea leer más de este autor? Dimitris realiza publicaciones en blog de forma regular sobre temas como el almacenamiento, el rendimiento, backup, recuperación y archivado en recoverymonkey.org. Sus publicaciones detalladas y con orientación técnica a menudo generan discusiones detalladas y a veces animadas en la misma medida.

En profundidad
 
TRUSTe
Póngase en contacto con nosotros   |   Cómo comprar   |   Comentarios   |   Empleo  |   Suscripciones   |   Política de privacidad   |   © 2012 NetApp