A Nvidia anunciou sua mais recente GPU para data centers, a Blackwell Ultra.
O chip é construído na arquitetura Blackwell apresentada no ano passado. A Nvidia adotou uma cadência anual de lançamento de GPU desde o surgimento da IA.
O Blackwell Ultra vem na solução de escala de rack Nvidia GB300 NVL72 e no sistema Nvidia HGX B300 NVL16.
O GB300 NVL72 conecta 72 GPUs Blackwell Ultra e 36 CPUs Nvidia Grace baseadas em Arm Neoverse em um único rack refrigerado a líquido, que a empresa diz oferecer 1,5 vezes mais desempenho de IA do que o Nvidia GB200 NVL72.
O Ultra combina duas GPUs do tamanho de um retículo, tem 15 petaflops de desempenho FP4 e 288 GB HBM3e.
Os produtos Ultra devem ser entregues a partir do segundo semestre de 2025, embora deva ser destacado que as GPUs Blackwell sofreram atrasos e não chegaram ao seu lançamento.
A Cisco, a Dell Technologies, a Hewlett Packard Enterprise, a Lenovo e a Supermicro devem fornecer uma ampla gama de servidores baseados no Blackwell Ultra. Servidores da Aivres, ASRock Rack, ASUS, Eviden, Foxconn, Gigabyte, Inventec, Pegatron, Quanta Cloud Technology (QCT), Wistron e Wiwynn também são esperados.
Hiperescalas e neoclouds também planejam oferecer instâncias com tecnologia Blackwell Ultra, incluindo Amazon Web Services, Google Cloud, Microsoft Azure e Oracle Cloud Infrastructure, juntamente com CoreWeave, Crusoe, Lambda, Nebius, Nscale, Yotta e YTL.
A própria Nvidia oferecerá acesso ao GB300 NVL72 em sua DGX Cloud.