A Nvidia anunciou sua mais recente GPU para data centers, a Blackwell Ultra.

O chip é construído na arquitetura Blackwell apresentada no ano passado. A Nvidia adotou uma cadência anual de lançamento de GPU desde o surgimento da IA.

O Blackwell Ultra vem na solução de escala de rack Nvidia GB300 NVL72 e no sistema Nvidia HGX B300 NVL16.

O GB300 NVL72 conecta 72 GPUs Blackwell Ultra e 36 CPUs Nvidia Grace baseadas em Arm Neoverse em um único rack refrigerado a líquido, que a empresa diz oferecer 1,5 vezes mais desempenho de IA do que o Nvidia GB200 NVL72.

O Ultra combina duas GPUs do tamanho de um retículo, tem 15 petaflops de desempenho FP4 e 288 GB HBM3e.

Os produtos Ultra devem ser entregues a partir do segundo semestre de 2025, embora deva ser destacado que as GPUs Blackwell sofreram atrasos e não chegaram ao seu lançamento.

A Cisco, a Dell Technologies, a Hewlett Packard Enterprise, a Lenovo e a Supermicro devem fornecer uma ampla gama de servidores baseados no Blackwell Ultra. Servidores da Aivres, ASRock Rack, ASUS, Eviden, Foxconn, Gigabyte, Inventec, Pegatron, Quanta Cloud Technology (QCT), Wistron e Wiwynn também são esperados.

Hiperescalas e neoclouds também planejam oferecer instâncias com tecnologia Blackwell Ultra, incluindo Amazon Web Services, Google Cloud, Microsoft Azure e Oracle Cloud Infrastructure, juntamente com CoreWeave, Crusoe, Lambda, Nebius, Nscale, Yotta e YTL.

A própria Nvidia oferecerá acesso ao GB300 NVL72 em sua DGX Cloud.