Almacenamiento ágil y flexible para impulsar una analítica moderna

Los datos son el activo más importante para las organizaciones. Pero de nada sirve acumular cantidades ingentes de datos en sistemas tradicionales lentos y complejos, que no permiten exprimir todo su potencial. La elección de un sistema de almacenamiento es esencial para implementar una analítica de datos moderna.

agilidad

Los datos son auténtica mina de oro para las organizaciones. Sin embargo, hay dos formas de usar ese ‘oro’: atesorándolo en bruto o transformándolo en joyas, multiplicando así su valor mediante una labor de orfebrería. 

Y en esto consiste precisamente la analítica de datos. Se trata de aprovechar esa materia prima, que ya está en poder de las organizaciones, para sacarle todo el jugo y aportar valor, ya sea en la mejora de su toma de decisiones, de sus procesos, etc.

Empresas e instituciones se han dado cuenta de que tienen un activo muy valioso y saben que no lo deben desaprovechar, por lo que el mercado del análisis de datos está creciendo con rapidez. Según los pronósticos de Market Research Future, el mercado global del análisis de datos alcanzará un valor de 132.903,8 millones de dólares en 2026, casi siete veces más que en 2019 (22.998,8 millones de dólares), con una tasa de crecimiento anual del 28,9%. 

 

Hacia un nuevo modelo

Las aplicaciones de análisis modernas han llegado para ayudar a las organizaciones en su transformación digital, permitiendo que los responsables de la toma de decisiones dispongan de una información crucial en tiempo real. Pero para que sea así, se necesita una nueva arquitectura para los datos analíticos, eliminando los retrasos que originan los sistemas tradicionales de análisis por bloques.

La arquitectura de almacenamiento de conexión directa distribuida (DDAS, por sus siglas en inglés) fue diseñada para datos estáticos y predecibles. Este sistema servía para cargas de trabajo secuenciales por bloques, pero ha generado silos de datos o data lakes, limitando su disponibilidad, rapidez de acceso e interoperabilidad. 

Así pues, el DDAS no ofrece la agilidad y el rendimiento en tiempo real que requieren las aplicaciones modernas de análisis de datos o el aprendizaje automático. Sin embargo, en el mercado encontramos soluciones que permiten derribar estas barreras y entrar en la era moderna de las analíticas, donde la infraestructura debe tener una arquitectura preparada para proporcionar un rendimiento en tiempo real, con agilidad de y capaz de incorporar datos no estructurados.

 

Prueba FlashBlade

 

FlashBlade, una apuesta segura

FlashBlade es una de las respuestas de Pure Storage a las necesidades de flexibilidad, agilidad y fiabilidad que puedan tener las organizaciones para implementar analíticas de datos modernas. Éstas son algunas de las ventajas de esta solución:

Rapidez. FlashBlade cuenta con una arquitectura masivamente paralela, que evita los cuellos de botella y ofrece rendimiento en tiempo real. Además, funciona con rapidez tanto con archivos grandes como con ficheros pequeños. 

Escalabilidad. Las organizaciones pueden empezar a usar este servicio sólo son 7 blades e ir añadiendo más de forma sencilla, hasta llegar a las 150 blades.

Rendimiento. FlashBlade puede alcanzar hasta 15 Gb/s de ancho de banda con 15 blades en un solo chasis.

Capacidad. Ofrece petabytes de capacidad y concurrencia elástica, hasta decenas de miles de clientes, así como capacidad para decenas de miles de millones de objetos y archivos.

Sencillez. El modelo de suscripción Evergreen de Pure simplifica las compras y ofrece total flexibilidad, sin ciclos de actualización, tiempo de inactividad o recompras de terabytes que ya poseen las organizaciones. Asimismo, FlashBlade es fácilmente escalable horizontalmente y al instante, ya que basta con añadir nuevas blades. Además, se trata de un diseño ‘adecuado para todo’, que elimina la necesidad de realizar optimizaciones manuales.

Seguridad. También es una solución idónea para restaurar los datos rápidamente, dando respuesta a los acuerdos de nivel de servicio de recuperación de desastres.

 

Palanca para la investigación científica

El Centro de Investigación en Agrigenómica (CRAG) es uno de los clientes que ya están utilizando FlashBlade en España. Este caso de uso nos ofrece un ejemplo claro de la importancia que tiene un sistema de almacenamiento ágil y potente a la hora de impulsar la investigación.

Este centro necesitaba su reemplazar su entorno de almacenamiento basado en disco para satisfacer la demanda de velocidad y escalabilidad de su infraestructura de computación de alto rendimiento, dedicada a tareas tan exigentes como la secuenciación del genoma de animales y plantas.

Así pues, el CRAG decidió instalar un centro de datos FlashBlade para almacenar todos los datos científicos del clúster del centro, optando por una configuración con ocho blades de 17 TB conectados mediante enlaces de 40GbE a una red de 100GbE. Esta plataforma mantiene el sistema de archivos NFS existente y las cargas de trabajo mixtas generadas en los nodos de cómputo del clúster científico y los nodos virtuales soportados por el hipervisor KVM.

Gracias a FlashBlade, el CRAG ha logrado multiplicar por cuatro la velocidad de escritura, además de reducir un 60% el tiempo requerido para realizar copias de seguridad completas. Y también ha aumentado su estabilidad, eliminando las paradas imprevistas por sobrecargas del almacenamiento.

La latencia de la cabina es extremadamente baja; y eso que trabajamos con carpetas que pueden tener más de 200 millones de archivos. Antes, tardábamos días en saber qué había dentro de un directorio; ahora, lo sabemos en cuestión de minutos. Sin tocar nada más, hemos reducido el tiempo necesario para realizar una copia de seguridad completa de todo nuestro entorno, de las 250 horas que tardábamos antes a apenas 100 horas. Y realizando algunos cambios, esperamos hacerlo en menos de 24 horas”, señala Gonzalo Vera, jefe de Informática Científica del CRAG.

 



Para más información contacte con Pure Storage aquí.

Sectores verticales