Em Alta Copa do Mundo NotíciasPessoasAcontecimentos internacionaisConflitosPolítica

Converse com o Telinha

Telinha
Oi! Posso responder perguntas apenas com base nesta matéria. O que você quer saber?

Startup afirma ter superado limite do ChatGPT e solicita revisão científica

Startup Subquadratic afirma ter superado limite do ChatGPT, prometendo redução até 1.000 vezes no custo computacional; comunidade exige provas independentes

A equipe da Subquadratic celebra o lançamento do SubQ, novo modelo de linguagem que promete processar 12 milhões de tokens. Ao centro, os fundadores Justin Dangel (CEO) e Alexander Whedon (CTO) lideram o time de especialistas vindos de gigantes como Google DeepMind e Meta (Reprodução)
0:00
Carregando...
0:00
  • Startup Subquadratic, de Miami, afirma ter criado uma arquitetura de IA que reduz em até 1.000 vezes o custo computacional de modelos de linguagem, com o SubQ 1M-Preview baseado em atenção esparsa (SSA) para contextos de até 12 milhões de tokens.
  • Segundo a empresa, o ganho de eficiência é de até 7,2 vezes em textos de 128 mil tokens e acima de 52 vezes em 1 milhão de tokens, reduzindo a necessidade de estruturas como bancos de dados e prompts complexos.
  • Três produtos em beta privado foram anunciados: uma API, o SubQ Code e o SubQ Search; a startup levantou US$ 29 milhões em rodada semente e chega a uma avaliação de US$ 500 milhões.
  • A reação da comunidade técnica é mista, com pedidos de validação independente e questionamentos sobre benchmarks, amostras únicas e ausência de avaliações em áreas como matemática, segurança e desempenho multilíngue.
  • A Subquadratic promete divulgar um relatório técnico completo em breve; ainda não há adoção comprovada no mercado e o tema tem gerado debates sobre a viabilidade da abordagem.

A Subquadratic, startup de Miami, afirma ter criado uma arquitetura de IA que reduz drasticamente o custo computacional de modelos de linguagem de grande porte. O lançamento veio nesta terça-feira, 6, revelando o SubQ 1M-Preview baseado em uma abordagem chamada atenção esparsa subquadrática.

Segundo a empresa, a arquitetura torna possível processar até 12 milhões de tokens com ganho próximo de 1.000 vezes na eficiência de processamento. A promessa envolve menor necessidade de estruturas auxiliares, como bancos vetoriais, e menos engenharia de prompts.

O primeiro modelo, SubQ 1M-Preview, seria construído sobre uma arquitetura considerada linear no custo conforme o contexto cresce, ao contrário do cenário atual, que é predominantemente quadrático. A empresa ressalta ganhos de velocidade à medida que o contexto aumenta.

A Subquadratic apresentou três produtos em beta privado: uma API, o SubQ Code para programação e o SubQ Search. Em rodada semente, a empresa levantou US$ 29 milhões, com investidores conectados a OpenAI, Anthropic, Stripe e Brex. Avaliação de US$ 500 milhões é citada pelo The New Stack.

Comunidade técnica e dúvidas

Especialistas destacam dúvidas sobre a validade dos benchmarks apresentados, que privilegiariam tarefas com vantagem para a arquitetura proposta. Dados divulgados mostram 81,8% em SWE-Bench Verified e 95% no RULER 128K, mas falam em falta de avaliações amplas.

Críticos apontam ausência de testes de matemática, segurança, raciocínio geral e desempenho multilíngue, além de execuções únicas que não oferecem margem estatística. Comentários públicos divergentes já surgem entre pesquisadores.

Alguns especialistas avaliam que os resultados não configuram fraude, mas sugerem que a implementação ainda precisa de validação independente. A Subquadratic afirma que pretende publicar um relatório técnico completo em breve.

O que vem a seguir

Caso as métricas sejam corroboradas por validação externa, a tecnologia pode reduzir a dependência de buscas e de bancos de dados externos para IA. Em caso contrário, a empresa poderá enfrentar escrutínio da comunidade científica.

A prática atual de grandes players de IA envolve ampliar o contexto sem comprometer a qualidade. A Subquadratic enfatiza que seu modelo seria mais eficiente sem comprometer o raciocínio em textos longos.

Comentários 0

Entre na conversa da comunidade

Os comentários não representam a opinião do Portal Tela; a responsabilidade é do autor da mensagem. Conecte-se para comentar

Veja Mais