- OpenAI anunciou o Jalapeño, seu primeiro processador de inteligência, fabricado pela Broadcom, para inferência de IA.
- O Jalapeño é um ASIC projetado para executar inferência de modelos de linguagem e operar com diferentes LLMs; a Celestica auxiliou na industrialização.
- Amostras de engenharia já estão ativas, executando cargas de trabalho de aprendizado de máquina em laboratório, incluindo o GPT-5.3-Codex-Spark.
- A OpenAI diz que o desempenho por watt é substancialmente melhor do que o estado da arte; um relatório técnico completo será divulgado nos próximos meses.
- A implantação inicial está prevista para começar no final de 2026, marcando uma redução da dependência da Nvidia e ampliando a infraestrutura da OpenAI.
A OpenAI anunciou nesta quarta-feira, 24 de junho, o seu primeiro chip próprio para inferência de IA, o Jalapeño. O dispositivo foi desenvolvido pela OpenAI e será fabricado pela Broadcom, com apoio da Celestica na industrialização.
O Jalapeño é apresentado como um processador de inteligência, projetado do zero para suportar grandes modelos de linguagem. A empresa destaca que o chip foi concebido para operar com diferentes LLMs e atender às demandas atuais e futuras de inferência de IA.
Atualmente, amostras de engenharia do Jalapeño já estão em laboratórios, executando cargas de trabalho de aprendizado de máquina, incluindo o GPT-5.3-Codex-Spark. A inferência é o estágio em que o modelo utiliza seus parâmetros treinados para gerar respostas a novas entradas.
O Jalapeño é um ASIC, ou seja, um circuito integrado de aplicação específica, mais barato que GPUs convencionais, porém menos flexível. A OpenAI não apenas promete custos reduzidos como também aponta ganhos de eficiência energética.
Quanto ao desempenho, a OpenAI afirma estar ainda avaliando o potencial total do chip. Dados preliminares indicam melhoria significativa de performance por watt em relação ao estado da arte atual, com um relatório técnico completo previsto para os próximos meses.
A empresa vê o Jalapeño como parte de uma estratégia de infraestrutura full-stack para ampliar a disponibilidade de computação. A meta é tornar a IA mais rápida, confiável e acessível para pessoas e empresas, ajudando a resolver problemas relevantes.
Richard Ho, responsável pelo programa de hardware da OpenAI, reforçou que a arquitetura foi otimizada para kernels, movimentação de dados na memória, rede e disponibilização de modelos. Os primeiros resultados indicam que o Jalapeño pode lidar com as cargas de trabalho mais importantes próxima aos limites teóricos do hardware.
Hock Tan, CEO da Broadcom, afirmou que o jalapeño marca o início de um roadmap para várias gerações de chips. A implantação inicial da nova plataforma está prevista para ocorrer no fim de 2026, segundo a empresa.
A parceria abre caminho para reduzir a dependência da OpenAI em relação a fornecedores tradicionais de hardware, como a Nvidia, atual líder no fornecimento de processadores para data centers. A expectativa é ampliar a flexibilidade infrastrutural da OpenAI no longo prazo.
Entre na conversa da comunidade