NVIDIA amplia inferência de IA em até 35x com racks para modelos gigantes

A NVIDIA apresentou o Groq 3 LPX, uma unidade de processamento de linguagem destinada a aumentar a inferência de IA em até 35x, com rack de 256 chips, 128 GB de SRAM e 12 TB de memória DDR5, para modelos com trilhões de parâmetros, enviado antes do previsto para o terceiro trimestre de 2026.
O anúncio integra a plataforma Vera Rubin, e, segundo a imprensa taiwanesa, a remessa acelerada mostra como a NVIDIA acelera a expansão da infraestrutura para IA.
A cadeia de suprimentos indica que os chips LP30 e LP35 presentes nos racks LPX deve alcançar 1,5 milhão de unidades em 2026 e 2,5 milhões em 2027.
A Foxconn seria fornecedora exclusiva da bandeja de computação Groq 3 LPX e grande responsável pela montagem dos gabinetes, com participação da empresa passando de 55% para 60% no segundo semestre de 2026 devido à demanda.
Espera-se que os racks Vera Rubin “NVL72” atinjam 12.000 unidades em 2026, com Google, Amazon Web Services e Microsoft como principais clientes; a produção em massa do servidor Vera Rubin VR200 NVL72 deve começar até o final do terceiro trimestre de 2026.

Durante a GTC 2026, a NVIDIA revelou o Groq 3 LPX, uma LPU (Unidade de Processamento de Linguagem) pensada para acelerar a inferência de IA em até 35 vezes. O anúncio inclui a plataforma Vera Rubin, destinada a suportar modelos de IA com trilhões de parâmetros, em um rack com 256 chips, 128 GB de SRAM e 12 TB de memória DDR5.

Segundo a imprensa taiwanesa, o envio do Groq 3 LPX já estaria em andamento antes do previsto, com entrega prevista para o terceiro trimestre de 2026. A notícia integra a estratégia da NVIDIA de ampliar a infraestrutura da Vera Rubin para atender a demanda por IA de grande escala.

Originalmente, as remessas previstas eram restritas a este ano. Novas informações indicam que os chips LP30 e LP35, presentes nos racks LPX, devem alcançar 1,5 milhão de unidades em 2026 e 2,5 milhões em 2027. A Foxconn aparece como fornecedora exclusiva da bandeja de computação e responsável pela montagem do gabinete LPX.

Fornecedor e demanda

A Foxconn, maior fabricante mundial de eletrônicos de consumo, entre os principais itens está prevista para entregar 6.000 racks Groq 3 LPX neste ano, com mais 10.000 em 2027. Racks LPX de próxima geração, com chips LP40, entram no mix em 2027.

Os racks Vera Rubin NVL72 devem chegar a 12.000 unidades em 2026, com clientes como Google, Amazon AWS e Microsoft. A produção em massa dos servidores Vera Rubin VR200 NVL72 está prevista para começar até o fim do terceiro trimestre de 2026.

Capacidade de produção e metas

A Foxconn também expandirá a produção para atender à demanda de IA da NVIDIA. O CEO Liu Yangwei afirmou que a empresa pode produzir mais de 1.000 gabinetes por semana, com perspectiva de chegar a 2.000 gabinetes semanais até o fim de 2026.