Na semana seguinte ao governo dos EUA endossar um plano para injetar meio trilhão de dólares na construção da infraestrutura de computação mais poderosa do mundo, os preços das ações de tecnologia despencaram.
Isso porque uma pequena empresa na China mostrou que poderia haver outra maneira e aterrorizou os proponentes mais vocais da IA.
Enquanto a tecnologia dos EUA está presa em uma guerra sobre computação e quem pode implementar o maior data center, a DeepSeek da China lançou um chatbot R1 barato que parece ser tão bom quanto os modelos o1 mais recentes da OpenAI.
O modelo DeepSeek-V3 de código aberto da empresa foi construído em uma execução de treinamento que custou 5,6 milhões de dólares – 32,5 milhões de reais – (embora haja muitas ressalvas, que analisaremos), usando hardware inferior às implantações dos EUA.
Devido às sanções, a DeepSeek afirma que usou 2.048 GPUs H800, a versão chinesa do H100, que tem 50% da taxa de transferência. Artigos publicados pela empresa mostram que ela também possui 10.000 GPUs A100.
Isso, se for verdade, derruba a atual filosofia do Vale do Silício de construções de data centers cada vez maiores e mais caras, levantando a questão de quão necessário é injetar 500 bilhões de dólares (3 trilhões de reais) no Stargate e centenas de bilhões a mais em data centers, chips e equipamentos de rede.
Há, como sempre, mais nuances na situação. Mesmo que o DeepSeek esteja dizendo a verdade, a realidade é que o modelo não custou 5,6 milhões de dólares – esse é apenas o custo da execução final. A criação de modelos exige muita iteração e experimentação, às vezes com diferentes clusters em execução simultaneamente, portanto, o custo total provavelmente é muito maior. O número de 5,6 milhões de dólares também é baseado em um preço de aluguel de nuvem assumido, quando se acredita que a DeepSeek esteja usando seus próprios sistemas.
Enquanto isso, os críticos e céticos do DeepSeek estão convencidos de que a empresa está mentindo sobre suas capacidades de computação e escondendo um cluster H100 maior que contrabandeou para a China.
Dylan Patel, o respeitado analista da SemiAnalysis, afirma que a empresa tem um cluster H100 de 50.000 GPUs, um número também reivindicado pelo CEO da Scale AI, Alexandr Wang. Isso custaria bilhões, nem mesmo considerando os custos do mercado ilegal, elevando muito os custos do projeto.
No entanto, nenhum dos dois forneceu qualquer prova de tais alegações. A existência de tal cluster também não significa necessariamente que ele foi usado para esses modelos - a empresa-mãe High-Flyer inicialmente construiu sua computação para o trabalho quantitativo de fundos de hedge. Com a empresa administrando 8 bilhões de dólares (46,4 bilhões de reais) em ativos, não há sinal de que ela tenha mudado completamente seu portfólio para LLMs.
Uma terceira versão dos eventos poderia ser que um modelo maior foi treinado em um cluster H100 oculto e, em seguida, através do processo de destilação, um modelo menor foi desenvolvido para o sistema H800.
O cientista-chefe de IA da Meta, Yann LeCun, tem outra sugestão de como os modelos ficaram tão baratos – os benefícios do código aberto, que já foi essencial para a missão da OpenAI, mas agora há muito descartado.
A DeepSeek "lucrou com pesquisa aberta e código aberto", disse LeCun. "Eles tiveram novas ideias e as construíram em cima do trabalho de outras pessoas. Como seu trabalho é publicado e de código aberto, todos podem lucrar com isso".
Se o DeepSeek usou mais computação do que o alegado ou não, quase certamente usou menos do que os rivais dos EUA. Seus esforços parecem ser devidos ao velho ditado – a necessidade é a mãe de todas as invenções. As sanções e uma crescente hostilidade em relação à China forçaram os desenvolvedores do país a se concentrarem na otimização.
Enquanto Sam Altman sempre pode levantar outro bilhão e construir outro data center, fazendo com que a OpenAI se concentre em escala, a DeepSeek e outros desenvolvedores chineses tiveram que aprender a fazer o melhor com o que tinham.
Essa, no mínimo, é a percepção. Isso derrubou completamente a atual narrativa de IA generativa – dê-nos dinheiro, computação, dados e tempo suficientes, e construiremos uma inteligência incomparável.
Todo o conceito é baseado em uma promessa, que afirma que apenas algumas grandes mentes agrupadas na área de São Francisco serão capazes de criar algo que valha incontáveis trilhões.
A Microsoft já mostrou que não tem certeza, decidindo não participar do financiamento do Stargate. A Nvidia já está protegendo suas apostas, impulsionando o uso de GPUs para cargas de trabalho tradicionais de CPU e promovendo a robótica como a próxima grande novidade.
Pode muito bem ser que o modelo do Vale do Silício esteja correto, que gastar mais e construir mais vencerá, se permitido. Mas essas empresas só poderão fazê-lo se os investidores estiverem dispostos a fazer a aposta cara.
Conquistá-los ficou significativamente mais difícil, o que pode fazer com que o financiamento seque e o ímpeto diminua – o assassino final de qualquer onda de hype.
Para que qualquer bolha dure e faça a transição para um modelo de negócios sustentável, os investidores precisam ser aplacados por uma enxurrada interminável de anúncios e promessas. Todo o edifício tem que se sentir perpetuamente à beira de alcançar a terra prometida, e qualquer dado que mostre o contrário pode rapidamente fazer com que tudo se desfaça.
As dúvidas sobre a viabilidade do modelo de negócios de IA generativa são anteriores ao DeepSeek, mas sua aparência como um concorrente viável e acessível permitiu que essas preocupações viessem à tona.
A OpenAI e outros que promovem o modelo 'construa grande' devem aumentar suas promessas nos próximos dias e semanas para combater a narrativa.
Eles provavelmente apontarão para o Paradoxo de Jevons - que o aumento da eficiência no uso de recursos pode levar ao aumento do consumo de recursos. Eles argumentarão que também são eficientes, mas pergunte - se alguém pode fazer isso com GPUs limitadas a 2k, imagine o que podemos fazer com um milhão de GPUs mais poderosas?
A questão, no entanto, é se a comunidade de investimentos lhes dará tempo para provar isso ou se a era de ouro está chegando ao fim.