Em Alta Copa do Mundo NotíciasPessoasAcontecimentos internacionaisConflitosPolítica

Converse com o Telinha

Telinha
Oi! Posso responder perguntas apenas com base nesta matéria. O que você quer saber?

SubQ entrega 12 milhões de tokens a custo 1/5 do esperado

Subquadratic lança SubQ com janela de 12 milhões de tokens a cerca de 1/5 do custo, potencialmente reduzindo memórias onipresentes nos grandes modelos

Photo
0:00
Carregando...
0:00
  • Subquadratic lançou o SubQ, um LLM com janela de contexto de 12 milhões de tokens, a cerca de 1/5 do custo de modelos frontier.
  • A arquitetura SSA (Selective Attention) escala linearmente com o tamanho da entrada e é 52× mais rápida que o FlashAttention em 1 milhão de tokens.
  • Em custo, o SubQ roda por aproximadamente US$ 8, enquanto frontier models chegam a cerca de US$ 2,6 mil; na avaliação MRCR v2, o SubQ marcou 83 contra 78 do Opus, 39 do GPT-5.4 e 23 do Gemini 3.1 Pro.
  • Hoje existem dois produtos: uma API de 12 milhões de tokens e o SubQ Code, um CLI que carrega todo o repositório em uma única passagem; o projeto recebeu US$ 25 milhões em financiamento semente, com investidores como Javier Villamizar e Justin Mateen.
  • O grande questionamento é se o SubQ consegue escalar para capacidades de frontier ou se o mercado será dividido entre soluções de memória de contexto longo e modelos densos.

Subquadratic lançou SubQ, um LLM com contexto nativo de 12 milhões de tokens, oferecendo custo cerca de 1/5 do das grandes modelos atuais. A empresa divulga missão de superar hacks de memória em IA.

A empresa emergente SubQ recebeu aporte seed de 25 milhões de dólares e anunciou o lançamento comercial do seu modelo, baseado em arquitetura SSA (Subquadratic Selective Attention). Investidores incluem Javier Villamizar e Justin Mateen.

O funcionamento promete escalabilidade linear com o tamanho da entrada, segundo a empresa. Em testes, o SubQ mostra desempenho superior em contextos longos, com velocidade até 52 vezes maior que algumas soluções que hoje dominam o mercado.

Resultados de avaliação indicam alta precisão em tarefas de memória de longo alcance. Em métricas, o modelo alcançou 97% em uma prova de longo contexto com custo estimado de cerca de 8 dólares para 1 milhão de tokens, frente a milhares de dólares de frontiers.

A companhia aponta dois produtos ativos: uma API de 12M tokens e o SubQ Code, uma ferramenta de linha de comando que carrega todo o repositório do usuário em uma única passagem. O lançamento visa reduzir a necessidade de segmentação de dados.

Segundo a apresentação, a arquitetura SSA escala de forma linear e reduz a dependência de técnicas como RAG, vetores de recuperação e orquestração de agentes. A empresa afirma que a memória permanente entre sessões é viável com soluções associadas.

A comunidade de IA observa se o SubQ escala para capacidades de nível de frontier, além de atuar como um complemento aos modelos estabelecidos. A equipe tem formação de acadêmicos de renome e ex-funcionários de grandes empresas de tecnologia.

Paralelamente, o setor acompanha relatos sobre ações legais envolvendo IA no mundo, com uma disputa de valores entre empresas do setor, incluindo casos envolvendo pagamentos e alegações de uso indevido de tecnologia.

Comentários 0

Entre na conversa da comunidade

Os comentários não representam a opinião do Portal Tela; a responsabilidade é do autor da mensagem. Conecte-se para comentar

Veja Mais