Conmutador InfiniBand Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 en Producción
April 15, 2026
Un importante instituto de investigación de IA de Asia Oriental se enfrentó a un cuello de botella común pero crítico.El trabajo en el sector de la salud y la salud se ha reducido considerablemente en los últimos años.La causa raíz fue el tejido Ethernet heredado de 100Gb/s, donde la sobrecarga TCP/IP y la pérdida de paquetes durante los eventos incast causaron tiempos de inactividad de la GPU de hasta 35%.Tejido de latencia ultra baja que podría admitir RDMA y escalar a miles de nodos sin comprometer el rendimiento deterministaDespués de evaluar varias soluciones, seleccionaron lasMellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 (incluido el juego)El interruptor InfiniBand como el núcleo de su nueva arquitectura de la columna vertebral.
El despliegue se centró en elLos requisitos de seguridad de los sistemas de seguridad de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas decomo la capa de columna vertebral, con 32 interruptores de hoja que conectan 512 GPUs NVIDIA A100 a través de adaptadores ConnectX-7.920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDREl cambio proporciona 400Gb/s por puerto, duplicando el ancho de banda de las soluciones HDR anteriores manteniendo una latencia de conmutación de menos de un microsegundo.920-9B210-00FN-0D0 InfiniBand conmutador OPNLos ingenieros de red utilizaron la información detallada de las instalaciones y de los sistemas de suministro.Si el vehículo no está equipado con un dispositivo de seguridad, el vehículo deberá ser equipado con un dispositivo de seguridad.yLas especificaciones 920-9B210-00FN-0D0Para validar los requisitos de potencia y térmicos, lo que permite una integración perfecta en los racks existentes de 19 pulgadas.920-9B210-00FN-0D0 compatibles con el sistema operativotanto con la infraestructura HDR existente como con los puntos finales NDR más nuevos, lo que permite una migración por fases.
- Las ganancias de eficiencia de RDMA:Con elNVIDIA Mellanox 920-9B210-00FN-0D0 también está disponible en vivo.permitiendo el control de congestión basado en hardware, la latencia de escritura de RDMA disminuyó de 12 μs a 1.2 μs. La RDMA directa de la GPU (GDR) se hizo completamente efectiva, eliminando los cuellos de botella de la memoria de la CPU.
- Aceleración de las aplicaciones de HPC:Un código clave de modelado meteorológico (basado en MPI) vio una mejora de rendimiento de 2,7 veces debido al enrutamiento adaptativo del interruptor y las descargas colectivas de SHARP v2.
- Producción de capacitación de IA:Para un trabajo de capacitación LLM de 175 mil millones de parámetros, la nueva tela redujo el tiempo de reducción total en un 68%, mejorando la utilización general de la GPU del 62% al 91%.
- Simplicidad de funcionamiento:El920-9B210-00FN-0D0 Solución OPN de conmutador de banda anchaLos administradores informáticos informaron una reducción del 50% en el tiempo de resolución de problemas relacionados con la red.
Al evaluar el proyecto, el instituto de investigación comparó los920-9B210-00FN-0D0 precioA pesar de un mayor costo inicial, el costo total de propiedad (TCO) favoreció a InfiniBand debido a una mayor utilización de la GPU y una menor potencia por Gb / s.Las unidades están fácilmente disponibles como920-9B210-00FN-0D0 para la ventaLos cambios en la distribución de NVIDIA se realizan a través de los canales de distribución de NVIDIA, con tiempos de entrega significativamente más cortos que otros switches NDR.Las especificaciones 920-9B210-00FN-0D0También confirmó el apoyo a las fuentes de alimentación redundantes y los ventiladores intercambiables en caliente, cumpliendo con los requisitos de fiabilidad del instituto para las operaciones de investigación de IA las 24 horas del día, los 7 días de la semana.
| Parámetro | Detalle |
|---|---|
| Modelo | NVIDIA Mellanox 920-9B210-00FN-0D0 también está disponible en vivo. |
| Velocidad del puerto | NDR de 400 Gb/s (por puerto) |
| OPN de base | 920-9B210-00FN-0D0 InfiniBand conmutador OPN |
| Configuración completa | 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR |
El instituto de investigación de IA ha estandarizado ahora laLos requisitos de seguridad de los sistemas de seguridad de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas de seguridad de los sistemas deEste caso del mundo real demuestra que la tecnología de la tecnología de la información y la comunicación (TIC) es una herramienta muy útil para todas las futuras expansiones de clusters, incluida una estructura NDR200 de 2.048 GPU.NVIDIA Mellanox 920-9B210-00FN-0D0 también está disponible en vivo.Para los arquitectos y gerentes de TI que buscan eliminar los cuellos de botella de las redes, la tecnología de la información es un componente fundamental para lograr una escalabilidad lineal del rendimiento en entornos de IA y HPC.El920-9B210-00FN-0D0 Solución OPN de conmutador de banda anchaofrece un camino probado y listo para la producción.

