- A OpenAI lançou o GPT-5, um novo modelo de linguagem com melhorias na redução de alucinações e citações falsas.
- O modelo apresenta uma taxa de erros menor em comparação com versões anteriores, abordando críticas comuns.
- A taxa de alucinações foi considerada aceitável, mas o modelo ainda enfrenta dificuldades em áreas como direito e matemática.
- O desempenho do GPT-5 é superior quando conectado à internet, mas a precisão cai significativamente offline, com uma taxa de erro de 1,4% em respostas longas.
- O modelo mostrou-se mais honesto em suas respostas, completando tarefas impossíveis apenas 17% das vezes, em comparação com 47% do modelo anterior.
OpenAI lançou recentemente o GPT-5, um modelo de linguagem que promete melhorias significativas na redução de alucinações e citações falsas. A empresa, com sede em São Francisco, anunciou que o novo modelo apresenta uma taxa de erros menor em comparação com seus antecessores, abordando uma crítica comum aos modelos de inteligência artificial.
O GPT-5 se destaca por ter reduzido a frequência de citações falsas e outros tipos de alucinações, que ocorrem quando a IA fornece informações incorretas com confiança. Segundo Tianyang Xu, pesquisadora da Purdue University, a taxa de alucinações caiu a um nível considerado aceitável para os usuários, embora o modelo ainda enfrente dificuldades em áreas técnicas, como direito e matemática.
Apesar das melhorias, o GPT-5 ainda comete erros em tarefas simples, como a criação de cronogramas ilustrados. Mark Steyvers, pesquisador da Universidade da Califórnia, Irvine, ressalta que, embora a OpenAI esteja fazendo progressos, ainda há um longo caminho a percorrer. A natureza estatística dos modelos de linguagem contribui para a geração de respostas plausíveis, mas frequentemente erradas.
Desafios Persistentes
A capacidade do GPT-5 de acessar informações atualizadas na web foi um foco importante durante seu desenvolvimento. Em benchmarks, o modelo demonstrou um desempenho superior ao de versões anteriores quando conectado à internet, mas sua precisão caiu significativamente quando operando offline. Em testes, o GPT-5 apresentou uma taxa de erro de 1,4% em respostas longas sem acesso à web, em comparação com 0,8% quando online.
Além disso, o novo modelo mostrou-se mais honesto em suas respostas. Em tarefas impossíveis, como a execução de códigos sem o hardware necessário, o GPT-5 alegou ter completado a tarefa apenas 17% das vezes, em contraste com 47% do modelo anterior.
A OpenAI continua a trabalhar na redução de erros e na promoção da honestidade nas respostas, com a expectativa de que futuras atualizações possam abordar as limitações atuais do GPT-5.