IBM reveló detalles de la arquitectura del próximo procesador IBM Telum II y el acelerador IBM Spyre en Hot Chips 2024. Las nuevas tecnologías están diseñadas para aumentar considerablemente la capacidad de procesamiento en los sistemas mainframe IBM Z de próxima generación, lo que ayuda a acelerar el uso de los modelos de IA tradicionales, así como los grandes modelos de lenguaje de inteligencia artificial.
Ya que muchos de los proyectos de IA generativa que aprovechan modelos de lenguaje grandes (LLM, por sus siglas en inglés) pasan de la prueba de concepto a la producción, las demandas de soluciones energéticamente eficientes, seguras y escalables se han convertido en prioridades clave. Una investigación de Morgan Stanley publicada en agosto proyecta que las demandas de energía de la IA generativa se dispararán un 75% anualmente durante los próximos años, lo que la colocará en camino de consumir tanta energía en 2026 como España en 2022. Muchos clientes de IBM indican que cada vez son más importantes las decisiones arquitectónicas para apoyar modelos base de tamaño adecuado y enfoques híbridos por diseño para cargas de trabajo de IA.
Estas son las principales innovaciones presentadas:
“Nuestra sólida hoja de ruta multigeneracional nos posiciona a la vanguardia de las tendencias tecnológicas, incluidas las crecientes demandas de IA”, afirmó Tina Tarquinio, Vicepresidenta de gestión de productos IBM Z y LinuxONE. “El procesador Telum II y el acelerador Spyre están diseñados para ofrecer soluciones informáticas empresariales de alto rendimiento, seguras y con mayor eficiencia energética. Después de años de desarrollo, estas innovaciones se introducirán en nuestra plataforma IBM Z de próxima generación para que los clientes puedan aprovechar los LLM y la IA generativa a escala”.
El procesador Telum II y el acelerador IBM Spyre están fabricados por Samsung Foundry y están construidos sobre su nodo de proceso de 5 nm de alto rendimiento y eficiencia energética. Al trabajar en conjunto, admiten una variedad de casos de uso avanzados impulsados por IA diseñados para desbloquear valor empresarial y crear nuevas ventajas competitivas. Con métodos de conjunto de IA, los clientes pueden lograr resultados más rápidos y precisos en sus predicciones. La potencia de procesamiento combinada anunciada hoy para la aplicación de casos de uso de IA generativa, como la detección de fraudes en el cobre de seguros, la prevención del lavado de dinero y la implementación acelerada de asistentes de inteligencia artificial.
Especificaciones y métricas de rendimiento:
Procesador Telum II: con ocho núcleos de alto rendimiento que funcionan a 5.5 GHz, con 36 MB de caché L2 por núcleo y un aumento del 40 % en la capacidad de caché en el chip para un total de 360 MB. El caché de nivel 4 virtual de 2.88 GB por cajón de procesador proporciona un aumento del 40 % respecto a la generación anterior. El acelerador de IA integrado permite una inferencia de IA de alto rendimiento y baja latencia en las transacciones, mejorando, por ejemplo, la detección de fraudes durante las transacciones financieras, y proporciona un aumento de cuatro veces en la capacidad de cómputo por chip en comparación con la generación anterior.
La nueva unidad de aceleración de E/S (DPU) está integrada en el chip Telum II. Está diseñado para mejorar el manejo de datos con una densidad de E/S aumentada en un 50 %. Este avance mejora la eficiencia general y la escalabilidad de IBM Z, lo que les confiere un diseño pensado para manejar las cargas de trabajo de IA a gran escala y las aplicaciones intensivas en datos de las empresas actuales.
Acelerador Spyre: un acelerador de nivel empresarial especialmente diseñado que ofrece capacidades escalables para modelos de IA complejos y casos de uso de IA generativa. Cuenta con hasta 1 TB de memoria diseñada para funcionar en conjunto con las ocho tarjetas de un cajón IO normal, lo que admite cargas de trabajo de modelos de IA en todo el mainframe y está diseñado para no consumir más de 75 W por tarjeta. Cada chip tiene 32 núcleos de cómputo que admiten tipos de datos int8, fp8 y fp16 para aplicaciones de IA de baja latencia y alto rendimiento..
Disponibilidad
El procesador Telum II será el procesador central que impulsará las plataformas IBM Z e IBM LinuxONE de próxima generación de IBM. Se espera que Telum II y el acelerador IBM Spyre, entregados a través de tarjetas PCIe de interfaz estándar de alta velocidad, estén disponibles para los clientes IBM Z y LinuxONE en 2025.
Equinix Fabric ya está disponible en Monterrey y viene con nueva conectividad local directa a…
El prestigioso galardón marca 11 años de reconocimiento para la empresa.
A nivel global, la satisfacción relacionada con las inversiones en información y ciberseguridad aumentó 20…
El grooming sigue siendo un problema alarmante en la era digital actual, ESET comparte consejos…
El péndulo sigue moviéndose entre la capacidad de procesamiento y las nuevas tecnologías que no…
Por Fabio Kruzich, director del área de Consultoría de FICO para LATAM.