Los chips de inteligencia artificial Gaudi 3 de Intel ya están disponibles a través de IBM Cloud.

Anunciados por IBM en el evento Intel Vision 2025, los chips están disponibles en las regiones de nube de IBM en Frankfurt y Washington D. C.. Se espera que estén disponibles en Texas durante el segundo trimestre de 2025.

El acelerador Intel Gaudi 3 fue presentado por Intel en abril de 2024. La compañía afirma que el acelerador Gaudi 3 de 5 nm ofrece el doble de potencia de cómputo para IA FP8, cuatro veces más cómputo para IA BF16, el doble de ancho de banda de red y un aumento de 1,5 veces en el ancho de banda de memoria en comparación con su predecesor, el Gaudi 2. Además, en comparación con el Nvidia H100, ofrece una inferencia un 50 % mejor en promedio en los modelos Llama2 de Meta con parámetros de 7 B y 13 B, y en el modelo GPT-3 de OpenAI con parámetros de 175 B, a un costo mucho menor.

IBM espera que el chip de inteligencia artificial Intel Gaudi 3 ayude a sus clientes a probar, innovar e implementar soluciones de inteligencia artificial generativa de manera más efectiva.

"Al incorporar los aceleradores de IA Intel Gaudi 3 a IBM Cloud, permitimos a las empresas escalar cargas de trabajo de IA generativa con un rendimiento optimizado para la inferencia y el ajuste preciso. Esta colaboración subraya nuestro compromiso compartido de hacer que la IA sea más accesible y rentable para las empresas de todo el mundo", afirmó Saurabh Kulkarni, vicepresidente de estrategia de IA para centros de datos y gestión de productos de Intel.

Los chips Intel se pueden implementar a través de IBM Cloud Virtual Servers para instancias de nube VPC y a partir del segundo trimestre estarán disponibles como un nodo de trabajo en contenedor para clústeres de inteligencia artificial de Red Hat OpenShift y Red Hat OpenShift en IBM Cloud.

“Combinar el poder de Red Hat AI con los aceleradores de IA Intel Gaudi 3 en IBM Cloud ofrece a las organizaciones una vía clara para acelerar sus planes de IA. En Red Hat nos complace aprovechar nuestra larga colaboración con IBM e Intel para ofrecer soluciones integrales de IA de código abierto que ayuden a las organizaciones a aprovechar al máximo el valor de la IA y la IA generativa”, afirmó Steven Huels, vicepresidente de Ingeniería de IA de Red Hat.

IBM mostró por primera vez su intención de incorporar los chips de IA de Intel a su nube en agosto de 2024. La compañía también ofrece acceso a las GPU Nvidia H100 y ha anunciado que incorporará las GPU AMD Instinct M1300X en 2025.