InfiniBand en HPC: Las ventajas de Mellanox QM9700

October 9, 2025

últimas noticias de la compañía sobre InfiniBand en HPC: Las ventajas de Mellanox QM9700

El switch InfiniBand Mellanox QM9700 establece un nuevo punto de referencia para las redes HPC de próxima generación

PARA PUBLICACIÓN INMEDIATA

Sunnyvale, CA – La insaciable demanda de poder computacional en los modernos clústeres de Computación de Alto Rendimiento (HPC) e IA está llevando las infraestructuras de red a sus límites. Para abordar esto, la adopción de tecnología InfiniBand de alta velocidad y baja latencia se ha convertido en el estándar de facto para conectar las supercomputadoras más potentes del mundo. La división Mellanox de NVIDIA, pionera en este campo, ha vuelto a subir el listón con la introducción del switch cuántico Mellanox QM9700, una piedra angular para la próxima era de las redes HPC.

Rendimiento y escalabilidad sin precedentes para cargas de trabajo exigentes

El Mellanox QM9700 está diseñado para servir como la estructura fundamental para las infraestructuras de computación exaescala. Es compatible con NDR (Next Data Rate) InfiniBand, ofreciendo asombrosas velocidades de datos sin procesar de 400 Gb/s por puerto y un rendimiento bidireccional agregado de 162.6 Tb/s en un solo switch de 40 puertos. Esto representa un salto de rendimiento de 4x en comparación con la generación HDR anterior. Para las aplicaciones de HPC e IA, esto se traduce en tiempos de entrenamiento drásticamente reducidos para modelos complejos y un tiempo de solución más rápido para simulaciones científicas, lo que permite a los investigadores abordar problemas que antes se consideraban intratables.

El Mellanox QM9700: Una inmersión profunda en las ventajas arquitectónicas

Más allá de la velocidad bruta, el Mellanox QM9700 incorpora varias innovaciones arquitectónicas clave que consolidan su liderazgo en redes HPC:

  • Enrutamiento adaptativo y tecnología SHARP: El switch cuenta con enrutamiento adaptativo mejorado para evitar dinámicamente las rutas congestionadas, lo que garantiza un flujo de datos óptimo. Su compatibilidad con el Protocolo de Agregación y Reducción Jerárquica Escalable (SHARP) reduce la sobrecarga de la operación MPI al descargar las operaciones colectivas de la CPU al switch de red, acelerando el rendimiento hasta en un 50% para aplicaciones con gran cantidad de mensajes.
  • Telemetría avanzada y soporte RoCE: El software NVIDIA NetQ incorporado proporciona una visibilidad profunda del rendimiento de la red, lo que permite una gestión proactiva y diagnósticos rápidos. Si bien es una potencia de InfiniBand, el QM9700 también ofrece un soporte robusto para RoCE (RDMA sobre Ethernet Convergente), lo que proporciona flexibilidad para entornos de centros de datos heterogéneos.
  • Eficiencia energética y de refrigeración: A pesar de su inmenso poder, el switch está diseñado pensando en la eficiencia, con una optimización de energía a nivel de puerto que reduce el consumo de energía hasta en un 30% en comparación con los sistemas heredados, lo que reduce significativamente el Costo Total de Propiedad (TCO).

Impacto cuantificable en aplicaciones HPC e IA del mundo real

Las métricas de rendimiento del Mellanox QM9700 se traducen directamente en beneficios tangibles en varios sectores:

Dominio de la aplicación Métrica de rendimiento Mejora con QM9700 NDR InfiniBand
Modelado climático Tiempo por simulación Reducido en un 40%
Secuenciación genómica Rendimiento de procesamiento de datos Aumentado en 3.8x
Entrenamiento de modelos de lenguaje grandes (LLM) Tiempo de finalización del trabajo Reducido en un 60%

Conclusión y valor estratégico para empresas e instituciones de investigación

El switch cuántico NVIDIA Mellanox QM9700 es más que una simple actualización incremental; es un habilitador estratégico para la próxima década de descubrimiento computacional. Al proporcionar un ancho de banda sin igual, una latencia ultrabaja y capacidades de red inteligentes, elimina el cuello de botella de la red que históricamente ha restringido el rendimiento del clúster. Para las organizaciones que invierten en investigación de IA, simulaciones de computación cuántica o análisis de datos a gran escala, la implementación de una estructura InfiniBand NDR anclada por el QM9700 es un paso definitivo hacia el logro de la eficiencia a nivel de exaescala y el mantenimiento de una ventaja competitiva.