Tecnologia

OpenAI revela aumento nas alucinações dos modelos o3 e o4-mini em testes internos

OpenAI revela que novos modelos de raciocínio, o3 e o4 mini, apresentam taxas de alucinações alarmantes, chegando a 48%. Investigação em andamento.

OpenAI emite alerta: modelos o3 e o4-mini apresentam mais alucinações que versões anteriores (Foto: Gabby Jones/Bloomberg)

OpenAI emite alerta: modelos o3 e o4-mini apresentam mais alucinações que versões anteriores (Foto: Gabby Jones/Bloomberg)

Ouvir a notícia

OpenAI revela aumento nas alucinações dos modelos o3 e o4-mini em testes internos - OpenAI revela aumento nas alucinações dos modelos o3 e o4-mini em testes internos

0:000:00

OpenAI identifica aumento de “alucinações” em novos modelos de IA

A OpenAI revelou que seus novos modelos de raciocínio, o3 e o4-mini, apresentam taxas de respostas incorretas ou inventadas – as chamadas “alucinações” – quase duas vezes maiores do que o modelo o1. A informação foi divulgada após testes internos realizados pelo sistema de avaliação PersonQA, desenvolvido pela própria empresa.

Os modelos o3 e o4-mini foram lançados recentemente com foco em aprimorar a programação, navegação na web e geração de imagens. Apesar das melhorias, os testes indicaram um aumento significativo na produção de informações imprecisas. O o4-mini atingiu uma taxa de alucinações de 48%, superando os resultados do o1 e o3.

A OpenAI explica que modelos menores, como o o4-mini, tendem a apresentar mais alucinações devido ao menor conhecimento do mundo. A empresa ressalta que o aumento era esperado, mas segue investigando as causas do problema. “Combater as alucinações em todos os modelos é uma área de pesquisa contínua”, afirmou Niko Felix, porta-voz da OpenAI, ao TechCrunch.

O modelo o3 também apresentou um aumento nas alucinações, atingindo 33% das respostas, em comparação com o o1. A avaliação PersonQA mede a precisão das respostas dos modelos, analisando dois critérios principais. A OpenAI busca entender o motivo do aumento das alucinações especificamente nos modelos de raciocínio.

A empresa detalhou que o o3 tende a fazer mais afirmações em geral, o que pode levar tanto a respostas mais precisas quanto a informações imprecisas. Apesar dos resultados, a OpenAI garante que a precisão e a confiabilidade dos modelos continuam sendo prioridade. A empresa se comprometeu a aprimorar os modelos para reduzir a ocorrência de alucinações.

Meu Tela
Descubra mais com asperguntas relacionadas
crie uma conta e explore as notícias de forma gratuita.acessar o meu tela

Perguntas Relacionadas

Participe da comunidadecomentando
Faça o login e comente as notícias de forma totalmente gratuita
No Portal Tela, você pode conferir comentários e opiniões de outros membros da comunidade.acessar o meu tela

Comentários

Os comentários não representam a opinião do Portal Tela;
a responsabilidade é do autor da mensagem.

Meu Tela

Priorize os conteúdos mais relevantes para você

Experimente o Meu Tela

Crie sua conta e desbloqueie uma experiência personalizada.


No Meu Tela, o conteúdo é definido de acordo com o que é mais relevante para você.

Acessar o Meu Tela