SubQ entrega 12 milhões de tokens a custo 1/5 do esperado

Subquadratic lançou o SubQ, um LLM com janela de contexto de 12 milhões de tokens, a cerca de 1/5 do custo de modelos frontier.
A arquitetura SSA (Selective Attention) escala linearmente com o tamanho da entrada e é 52× mais rápida que o FlashAttention em 1 milhão de tokens.
Em custo, o SubQ roda por aproximadamente US$ 8, enquanto frontier models chegam a cerca de US$ 2,6 mil; na avaliação MRCR v2, o SubQ marcou 83 contra 78 do Opus, 39 do GPT-5.4 e 23 do Gemini 3.1 Pro.
Hoje existem dois produtos: uma API de 12 milhões de tokens e o SubQ Code, um CLI que carrega todo o repositório em uma única passagem; o projeto recebeu US$ 25 milhões em financiamento semente, com investidores como Javier Villamizar e Justin Mateen.
O grande questionamento é se o SubQ consegue escalar para capacidades de frontier ou se o mercado será dividido entre soluções de memória de contexto longo e modelos densos.

Subquadratic lançou SubQ, um LLM com contexto nativo de 12 milhões de tokens, oferecendo custo cerca de 1/5 do das grandes modelos atuais. A empresa divulga missão de superar hacks de memória em IA.

A empresa emergente SubQ recebeu aporte seed de 25 milhões de dólares e anunciou o lançamento comercial do seu modelo, baseado em arquitetura SSA (Subquadratic Selective Attention). Investidores incluem Javier Villamizar e Justin Mateen.

O funcionamento promete escalabilidade linear com o tamanho da entrada, segundo a empresa. Em testes, o SubQ mostra desempenho superior em contextos longos, com velocidade até 52 vezes maior que algumas soluções que hoje dominam o mercado.

Resultados de avaliação indicam alta precisão em tarefas de memória de longo alcance. Em métricas, o modelo alcançou 97% em uma prova de longo contexto com custo estimado de cerca de 8 dólares para 1 milhão de tokens, frente a milhares de dólares de frontiers.

A companhia aponta dois produtos ativos: uma API de 12M tokens e o SubQ Code, uma ferramenta de linha de comando que carrega todo o repositório do usuário em uma única passagem. O lançamento visa reduzir a necessidade de segmentação de dados.

Segundo a apresentação, a arquitetura SSA escala de forma linear e reduz a dependência de técnicas como RAG, vetores de recuperação e orquestração de agentes. A empresa afirma que a memória permanente entre sessões é viável com soluções associadas.

A comunidade de IA observa se o SubQ escala para capacidades de nível de frontier, além de atuar como um complemento aos modelos estabelecidos. A equipe tem formação de acadêmicos de renome e ex-funcionários de grandes empresas de tecnologia.

Paralelamente, o setor acompanha relatos sobre ações legais envolvendo IA no mundo, com uma disputa de valores entre empresas do setor, incluindo casos envolvendo pagamentos e alegações de uso indevido de tecnologia.

Converse com o Telinha

SubQ entrega 12 milhões de tokens a custo 1/5 do esperado

Relacionados:

Comentários 0

Entre na conversa da comunidade

Veja Mais

Converse com o Telinha

SubQ entrega 12 milhões de tokens a custo 1/5 do esperado

Relacionados:

Comentários 0

Entre na conversa da comunidade

Veja Mais

Fique por dentro