Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 1

En SC23, vimos el nuevo sistema de GPU universal Supermicro 4U. Es un sistema refrigerado por líquido diseñado para los despliegues más densos. Como hemos estado trabajando mucho en la refrigeración líquida, decidimos mostrarla mientras el equipo miraba las fotografías de la exhibición.

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida

En SC23 echamos un vistazo al nuevo sistema de GPU universal Supermicro 4U. Supermicro ofrece una serie de modelos de 8U optimizados para refrigeración por aire o líquido, pero este diseño está diseñado específicamente para aprovechar la refrigeración líquida para aumentar significativamente la densidad.

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 2
Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 2

El colector de refrigeración líquida es una solución horizontal, como hemos mostrado anteriormente en STH. Esto permite que las boquillas de enfriamiento del sistema se desconecten rápidamente del colector.

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 3
Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 3

En este sistema, la plataforma superior es la NVIDIA HGX H100 de 8 GPU con plataforma NVSwitch. En el futuro, Supermicro dice que admitirá las GPU HGX H200.

No pudimos mover el bastidor, pero detrás de la unidad hay cuatro fuentes de alimentación (dos instaladas) y un enorme conjunto de ranuras para tarjetas de expansión de E/S de perfil bajo y altura completa. También obtenemos el puerto de administración fuera de banda del BMC, dos puertos USB 3 y un puerto VGA.

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 7
Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 7

Al retirar la bandeja de la CPU, vemos un servidor Intel Xeon dual destinado a Sapphire Rapids (Intel de cuarta generación). Cada uno tiene un conjunto completo de 16 ranuras DIMM DDR5 para un total de 32.

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 4
Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 4

Las CPU del sistema están refrigeradas por líquido, ya que el zócalo de Intel tiene un TDP de hasta 385 W y en estos servidores GPU se suelen utilizar CPU de alta gama.

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 5
Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 5

Nuestros lectores notarán que este chasis contiene ventiladores. Los ventiladores permiten a Supermicro enfriar DIMM, SSD M.2, SSD de 2,5 ″ y tarjetas de E/S traseras sin la necesidad de placas frías en todos estos dispositivos.

Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 6
Sistema de GPU universal Supermicro 4U para NVIDIA HGX H100 y HGX 200 con refrigeración líquida en SC23 6

Aquí podemos ver las dos jaulas para un total de 8 SSD NVMe de 2,5 pulgadas en la parte frontal del sistema.

Ultimas palabras

En general, este nuevo sistema sigue la filosofía de diseño de Supermicro para servidores de IA, excepto que está principalmente refrigerado por líquido. Un servidor GPU de 4U presenta un desafío de refrigeración porque cada uno puede utilizar alrededor de 10 kW de potencia. Diez de estos en un rack de 45U tendrían 100 kW. El uso de refrigeración líquida normalmente elimina entre el 10 y el 15 % del consumo de energía, pero eso sigue siendo entre 80 y 90 kW en el rack antes de agregar interruptores.

Supermicro tiene varios clientes de GPU a gran escala que pueden usar refrigeración líquida, generar más energía y necesitar más densidad. Este es el tipo de cliente para el que está diseñado este sistema.

Si está interesado en obtener más información sobre la refrigeración líquida de Supermicro, ya hemos revisado el servidor 8U con refrigeración líquida Supermicro SYS-821GE-TNHR 8x NVIDIA H100 AI y el bastidor de refrigeración líquida personalizado de Supermicro.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *