NVIDIA Mellanox MCX653105A-HDAT Adaptador de servidor en acción: RDMA / RoCE Transporte y servidor de baja latencia
June 15, 2026
En los centros de datos modernos, el almacenamiento distribuido, la computación de alto rendimiento (HPC) y los grupos de capacitación de IA se enfrentan a un cuello de botella común: la red.Las pilas TCP/IP tradicionales introducen una latencia significativa y gastos generales de la CPUEste estudio de caso examina cómo un proveedor de nube de tamaño mediano abordó estos mismos desafíos mediante la implementación de una plataforma de cloud computing que permite a los usuarios de la nube utilizar la nube en sus aplicaciones.NVIDIA Mellanox MCX653105A-HDAT, también conocido como NVIDIAAdaptador de servidor para permitir el transporte de baja latencia basado en RDMA / RoCE y aumentar dramáticamente el rendimiento del servidor.
Antecedentes y desafíos: Cuando cada microsegundo cuenta
La infraestructura 25GbE existente del proveedor, que ejecuta el estándar TCP / IP, estaba luchando para soportar su nuevo backend de almacenamiento NVMe-over-Fabrics.La utilización de la CPU en los nodos de almacenamiento superaba regularmente el 70% solo por el procesamiento de la red, y la latencia entre nodos oscilaba alrededor de 50 μs una cantidad inaceptable para sus cargas de trabajo de base de datos sensibles a la latencia.La congestión de la red causó picos de latencia de cola que afectaron a los SLA de la aplicaciónNecesitaban una solución que pudiera descargar los gastos generales de la red, proporcionar latencia inferior a un microsegundo y mantener un rendimiento constante bajo carga.
Solución y implementación: Introducción de la tarjeta de red PCIe MCX653105A-HDAT ConnectX Adaptador
Después de evaluar varias opciones, el equipo seleccionó elTarjeta de adaptador Ethernet MCX653105A-HDATEl sistema de conexión de la red a la red de la red de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión de la red de conexión.NVIDIA Mellanox MCX653105A-HDAT, también conocido como NVIDIAse implementó en 120 nodos de almacenamiento y computación, con la siguiente configuración:
- RoCE habilitadocon ECN (notificación explícita de congestión) y DCQCN para el control de la congestión
- NVMe-oF objetivo de descargaa hardware, eludiendo la CPU host para la E/S de almacenamiento
- Particiónen los flujos prioritarios sin pérdidas para el tráfico de almacenamiento
- Monitoreo de la telemetríautilizando los contadores de rendimiento incorporados en el adaptador
De acuerdo con elSi el vehículo no está equipado con un dispositivo de control de velocidad, se aplicará el procedimiento siguiente:, la tarjeta soporta tanto los protocolos InfiniBand como Ethernet, pero el equipo eligió RoCEv2 para integrarse sin problemas con sus switches Ethernet existentes.todos los modelos de servidores principales fueronCompatible con MCX653105A-HDATEl despliegue se completó durante dos fines de semana con cero tiempo de inactividad, utilizando las características de migración en vivo del adaptador.
Resultados y beneficios: ganancias de rendimiento medibles
El impacto fue inmediato y sustancial.La siguiente tabla resume las métricas clave antes y después de la implementación delSolución de tarjeta de adaptador Ethernet MCX653105A-HDAT:
| El método métrico | Antes (TCP/IP) | Después de (RoCE + MCX653105A-HDAT) | Mejora |
|---|---|---|---|
| La latencia media (nodo a nodo) | 52 μs | 1.8 μs | 96Reducción del 0,5% |
| Uso de la CPU (nodo de almacenamiento, pila de red) | El 72% | El 8% | Reducción del 89% |
| Producción efectiva por nodo (NVMe-oF) | 18 Gbps | 96 Gbps | 5.3 veces más |
| La latencia de la cola (99,9 por ciento) | 380 μs | 12 μs | 96Reducción del 0,8% |
Además de estas cifras, el equipo observó beneficios operativos adicionales.Las especificaciones MCX653105A-HDATEn la actualidad, el sistema de seguimiento de conexiones basado en hardware y la descarga de flujo ASAP2 han reducido el jitter del tráfico Este-Oeste y han permitido una escalabilidad más fluida.Precio de MCX653105A-HDATEl adaptador es ahora ampliamente utilizado en el mercado de la tecnología de procesamiento de datos, y el procesador de datos se ha convertido en una herramienta de procesamiento de datos.MCX653105A-HDAT para la ventaEl objetivo de este programa es mejorar la calidad de la información y la calidad de los servicios, a través de canales estándar, haciendo que este rendimiento sea accesible a organizaciones de todos los tamaños.
Resumen y perspectivas: Una base para la infraestructura de próxima generación
Este caso demuestra que elMCX653105A-HDAT Adaptador ConnectX tarjeta de red PCIeLa tecnología de la información no es simplemente una NIC más rápida, sino una plataforma para una verdadera computación centrada en los datos.NVIDIA Mellanox MCX653105A-HDAT, también conocido como NVIDIATransforma la forma en que los servidores se comunican, eliminando los protocolos heredados y desbloqueando todo el potencial del almacenamiento NVMe y las telas de memoria distribuidas.
En el futuro, el proveedor planea ampliar su implementación para incluir GPUDirect RDMA para cargas de trabajo de capacitación de IA,así como explorar las características de programabilidad del adaptador para el procesamiento de paquetes personalizadosPara los arquitectos de TI e ingenieros de redes que se enfrentan a retos de escalabilidad similares, elTarjeta de adaptador Ethernet MCX653105A-HDATofrece un camino comprobado y preparado para el futuro hacia una red de centros de datos de baja latencia y alto rendimiento.

