Categories: CloudSaaS

Hewlett Packard Enterprise estrena portafolio integral para la IA generativa

En NVIDIA GTC, Hewlett Packard Enterprise anunció actualizaciones a uno de los portafolios nativos de IA más completos de la industria para acelerar la operativización de las aplicaciones de IA generativa (GenAI, por sus siglas en inglés), aprendizaje profundo y aprendizaje automático (ML, por sus siglas en inglés). Las actualizaciones son:

  • Disponibilidad de dos soluciones GenAI completas codesarrolladas por HPE y NVIDIA.
  • Una versión preliminar del software HPE Machine Learning Inference.
  • Una arquitectura de referencia de generación aumentada de recuperación (RAG, por sus siglas en inglés).
  • Soporte para desarrollar productos futuros basados en la nueva plataforma NVIDIA Blackwell.

“Para cumplir la promesa de la GenAI y abordar con eficacia todo el ciclo de vida de la IA, las soluciones deben ser híbridas por diseño”, dijo Antonio Neri, presidente y CEO de HPE. “Desde entrenamiento y optimización de modelos localmente, en un centro de datos o en la nube pública hasta inferencia en la periferia, la IA es una carga de trabajo híbrida. HPE y NVIDIA tienen un largo historial de innovación colaborativa y seguimos ofreciendo soluciones de software y hardware de IA diseñadas conjuntamente para ayudar a nuestros clientes a acelerar el desarrollo y la implementación de GenAI desde el concepto hasta la producción”.

“La IA generativa puede convertir los datos de dispositivos conectados, centros de datos y nubes en ideas que pueden impulsar los avances entre las industrias”, dijo Jensen Huang, fundador y CEO de NVIDIA “. Nuestra creciente colaboración con HPE permitirá a las empresas entregar una productividad sin precedente al aprovechar sus datos para desarrollar e implementar nuevas aplicaciones de IA para transformar sus negocios”.

Entrenamiento y optimización de GenAI impulsados por supercomputación

Anunciada en SC23, la solución de supercomputación de HPE para la IA generativa ya está disponible para pedido para las organizaciones que buscan una solución integral previamente configurada y probada para el desarrollo y entrenamiento de grandes modelos de IA. Diseñada específicamente para ayudar a los clientes a acelerar sus proyectos de GenAI y aprendizaje profundo, la solución lista para usarse está potenciada por NVIDIA y soporta hasta 168 superchips Grace Hopper GH200. La solución permite a empresas grandes, las instituciones de investigación y las entidades gubernamentales optimizar el portafolio de desarrollo de modelos con una pila de software de IA/ML que ayuda a los clientes a acelerar los proyectos de GenAI y aprendizaje profundo, incluyendo LLM, sistemas de recomendaciones y bases de datos vectoriales. Entregada con servicios de instalación y configuración, esta solución lista para usarse está diseñada para que los centros de investigación de IA y las empresas mejoren el tiempo de obtención de valor y dupliquen o tripliquen la velocidad del entrenamiento.

Para más información o realizar un pedido, visite la solución de supercomputación de HPE para la IA generativa. 

Optimización e inferencia de la GenAI empresarial

Anunciada en Discover Barcelona 2023, la solución de computación empresarial de HPE para la IA generativa ya está disponible para los clientes directamente o a través de HPE GreenLake con un modelo de pago por uso flexible y escalable. Diseñada en conjunto con NVIDIA, la solución de optimización e inferencia preconfigurada está diseñada para reducir el tiempo de producción y los costos, ya que ofrece los servicios de computación, almacenamiento, software, interconexión y consultoría que las organizaciones necesitan para producir aplicaciones de GenAI. La solución integral nativa de IA proporciona a las empresas la velocidad, escala y control necesarios para personalizar los modelos de base con datos privados e implementar aplicaciones de GenAI dentro de un modelo de nube híbrida.

Con un clúster de computación IA de alto rendimiento y software de HPE y NVIDIA, la solución es ideal para la optimización ligera de modelos, RAG, e inferencia de escalamiento horizontal. El tiempo de optimización para un modelo Llama 2 con 70,000 millones de parámetros que ejecuta esta solución, disminuye linealmente con el conteo de nodos, lo que toma seis minutos en un sistema de 16 nodos[i]. La velocidad y el rendimiento permiten a los clientes acelerar el tiempo de obtención de valor y mejorar la productividad empresarial con aplicaciones de IA como asistentes virtuales, chatbots inteligentes y búsqueda empresarial.

Impulsada por servidores HPE ProLiant DL380a Gen11, la solución está preconfigurada con NVIDIA GPUs, la plataforma Spectrum-X Ethernet networking de NVIDIA y NVIDIA BlueField-3 DPUs. La solución se ha optimizado por la plataforma de aprendizaje automático y el software de análisis de HPE, el software NVIDIA AI Enterprise 5.0 con el nuevo microservicio NVIDIA NIM para una inferencia optimizada de modelos generativos de IA, así como NVIDIA NeMo Retriever y otras bibliotecas de ciencia de datos e IA.

Para abordar la brecha de habilidades de IA, los expertos de HPE Services ayudarán a las empresas a diseñar, implementar y gestionar la solución, lo que incluye aplicar técnicas adecuadas de optimización de modelos.

Julián Torrado

Recent Posts

El equipo de Fórmula Uno Aston Martin Aramco anuncia una asociación con Xerox

La marca Xerox será visible en el AMR24 en el Gran Premio de Las Vegas.

19 horas ago

La Inteligencia Artificial está revolucionando a las tiendas de barrio

Yalo observa que la IA es una herramienta transformadora que está cambiando el juego para…

19 horas ago

Infoblox Threat Intel identifica nuevos actores DNS maliciosos vinculados al secuestro de dominios

Más de 1 millón de dominios registrados podrían ser vulnerables diariamente

20 horas ago

¿Cuánto falta para la adopción masiva de la inteligencia artificial generativa en Chile?

Hablamos de una tecnología que impulsa el desarrollo de contenido de forma autónoma a través…

2 días ago

¿Cómo inmortalizar tus datos con el archivo empresarial en tiempo real?

Por Douglas Wallace, Gerente de Ventas de Distrito, América Latina y el Caribe (Excepto Brasil)…

2 días ago

México a la vanguardia de la robótica colaborativa: un análisis del panorama industrial

Por Uriel Fraire, Regional Sales Manager Mexico de Universal Robots.

2 días ago