A matemática por trás do chip Jalapeño da OpenAI

OpenAI desenvolveu o chip Jalapeño em parceria com a Broadcom para reduzir custos de infraestrutura e diminuir a dependência de hardware de terceiros, em meio a margens de lucro mais apertadas.
O Jalapeño é um processador voltado à inferência de modelos de linguagem grandes (LLMs); a OpenAI definiu o design, a Broadcom cuidou da engenharia do silício e integração de rede, a TSMC fabrica e a Celestica monta as placas.
Amostras de laboratório já operam com workloads de fronteira, incluindo o modelo não lançado GPT-5.3-Codex-Spark, em frequência e consumo-alvo.
A arquitetura busca minimizar a movimentação de dados, equilibrando compute, memória e rede para maximizar a utilização efetiva e reduzir gargalos em operações de atendimento a usuários.
O lançamento em data centers deve ocorrer até o final de 2026, com expansão junto a parceiros como a Microsoft; a OpenAI planeja investir cerca de US$ 1,4 trilhão em computação nos próximos oito anos, diante de custos operacionais elevados, como US$ 8,4 bilhões no ano anterior e cerca de US$ 14 bilhões neste ano.

OpenAI desenvolveu o Chip Jalapeño, uma peça de hardware customizada para reduzir os custos de infraestrutura no processamento de modelos de linguagem. A parceria principal é com a Broadcom, na criação do ASIC voltado à inferência de grandes modelos de linguagem (LLM).

O projeto difere de aceleradores generalistas ao priorizar o equilíbrio entre computação, memória e rede, visando diminuir a movimentação de dados. A produção envolve também a TSMC (Taiwan) para fabricação, e a Celestica para montagem de placas e racks.

Segundo a OpenAI, amostras de laboratório já executam workloads fronteira, incluindo um modelo não divulgado denominado GPT-5.3-Codex-Spark, com frequência e consumo de energia alinhados a metas de produção. A arquitetura busca utilidade teórica próxima do desempenho real.

O chip, chamado de primeiro “Intelligence Processor”, integra a rede da Broadcom Tomahawk para comunicação em grandes ambientes de data center. A ideia é ampliar a disponibilidade de compute, reduzindo custos de operação de longa duração.

A estratégia de integração vertical envolve software, memória, agendamento de rede e a camada de aplicação, permitindo que a OpenAI otimize a infraestrutura de acordo com seus roadmaps internos. A expectativa é reduzir custos de treinamento e atendimento.

Com o avanço do Jalapeño, a OpenAI busca acompanhar concorrentes que investem em hardware proprietário desde 2015, como a Google com TPUs. A empresa destaca que a produção rápida foi possível graças a uso de modelos próprios na automação de partes do desenho de hardware.

A implantação da nova infraestrutura está prevista para começar até o fim de 2026, com a participação de parceiros como a Microsoft para ampliar a integração em data centers de grande escala. A meta é sustentar o crescimento de usuários e faturamento sem comprometer a eficiência.