Intel ha anunciado nuevos procesadores con memoria de gran ancho de banda (HBM) dirigidos a la informática de alto rendimiento (HPC), la supercomputación y la inteligencia artificial (IA).
Estos productos se denominan serie Xeon CPU Max y serie GPU Max. Los chips se basan en tecnología existente; la CPU es Xeon Scalable de cuarta generación, también conocida como Sapphire Rapids, y la GPU es Ponte Vecchio, la versión para centros de datos de la tecnología de GPU Xe de Intel.
La diferencia es que estos dos procesadores vienen con HBM en el chip del procesador, en lugar de depender únicamente de la memoria DRAM estándar. La HBM es mucho más rápida que las memorias DDR4 o DDR5 y se instala en el chip del procesador junto al núcleo de la CPU/GPU con una interconexión de alta velocidad, en lugar de en un lápiz de memoria como la memoria DDR.
"Si nos fijamos en las cargas de trabajo generales de HPC e IA, hay mucha variedad", afirma Jeff McVeigh, vicepresidente y director general de supercomputación de Intel. "Tradicionalmente, ha habido dos rutas hacia la cima. Una es la ruta de la CPU y la segunda es la ruta de la GPU, cada una con sus propios obstáculos. Nuestro objetivo es avanzar de verdad y resolver estos problemas de forma integral."
Según McVeigh, el objetivo de CPU Max y GPU Max es maximizar el ancho de banda, maximizar el cálculo y maximizar las capacidades y posibilidades que ofrecen para hacer frente a la gran variedad de cargas de trabajo.
CPU máx.
CPU Max está disponible en tres configuraciones de servidor. La primera es que no hay DRAM, por lo que la única memoria del sistema es la HBM de 64 GB del chip CPU Max. Así es como funciona el superordenador Fugaku de Japón, que en su día fue uno de los más rápidos del mundo. En un sistema de doble zócalo, son 128 GB de memoria, que según McVeigh son "más que suficientes para muchas aplicaciones y cargas de trabajo". En este escenario de uso, la aplicación puede ejecutarse tal cual.
La segunda configuración, denominada HBM Planar Mode, combina HBM en el paquete de la CPU con una memoria DDR5 estándar en el sistema. Tanto el software de HBM como el de DDR deben optimizarse para mover datos entre estas regiones de memoria diferentes.
La tercera configuración es el modo de caché HBM, en el que HBM actúa como caché de la memoria DDR del sistema. En este modo, no es necesario cambiar el código de software. "Es posible que quieras hacer algunos ajustes para aprovechar las cachés tan grandes que tienes ahora, pero no tienes por qué hacerlo cuando obtienes un beneficio inmediato", afirma McVeigh.
Tarjeta gráfica máxima
GPU Max también está disponible en tres configuraciones: los modelos 1100, 1350 y 1550. La 1100 es una tarjeta PCIe de doble ancho de 300 vatios con 56 núcleos Xe y 48 GB de memoria HBM2e. Se pueden conectar varias tarjetas a través del puente Intel Xe Link Bridge.
Las otras dos configuraciones incorporan un módulo acelerador del Open Compute Project (OCP), denominado OAM, que es una interfaz alternativa más rápida a las tarjetas PCIe.
La GPU 1350 es un módulo OAM de 450 vatios con 112 núcleos Xe y 96 GB de HBM. La GPU 1550 es un módulo OAM de 600 vatios con 128 núcleos Xe y 128 GB de HBM.
Las tarjetas PCI Express son muy adecuadas para su uso en servidores estándar e incluso en sistemas de estaciones de trabajo, pero los módulos OAM están realmente orientados a entornos de mayor densidad, afirmó McVeigh. Dijo que Intel ha obtenido muchos diseños de sistemas desarrollados por OEM y proveedores de soluciones de sistemas, y que lanzarán servidores con OAM a partir de 2023.
Intel está construyendo un superordenador para el Laboratorio Nacional Argonne equipado con procesadores CPU Max y GPU Max que ofrecerá más de 2 exaFLOPs de rendimiento cuando entre en funcionamiento en 2023. Esto supone el doble de velocidad que Frontier, el actual líder en la carrera de los superordenadores. Según McVeigh, la combinación de ambos procesadores lo hace posible.
"Se podría argumentar que lo hemos descargado todo en la GPU y que no necesitamos la CPU de gama más alta, ¿verdad? No necesitamos memoria HBM, ¿verdad? Pues no. Si activamos la memoria HBM integrada en la CPU, podemos obtener importantes mejoras de rendimiento porque todavía hay mucho código ejecutándose en la CPU, aunque hayamos descargado algunos de los núcleos más grandes a la GPU", afirma.
Los nuevos procesadores ya han empezado a enviarse a los primeros clientes, entre ellos Argonne. El lanzamiento de la serie Max está previsto para enero de 2023.