Na quinta-feira, a Microsoft anunciou a implementação do modelo de raciocínio o1 da OpenAI para usuários do Copilot, enquanto a OpenAI lançou o novo modelo o3-mini para os usuários da versão gratuita do ChatGPT. Essa é a primeira vez que a maioria dos usuários terá acesso a um dos modelos de raciocínio da OpenAI, que […]
Na quinta-feira, a Microsoft anunciou a implementação do modelo de raciocínio o1 da OpenAI para usuários do Copilot, enquanto a OpenAI lançou o novo modelo o3-mini para os usuários da versão gratuita do ChatGPT. Essa é a primeira vez que a maioria dos usuários terá acesso a um dos modelos de raciocínio da OpenAI, que antes eram restritos aos pacotes pagos Pro e Plus. O modelo o3-mini representa um avanço significativo, pois entra no campo do raciocínio complexo, com aplicações em áreas como física e programação.
Os modelos de raciocínio utilizam uma técnica chamada “cadeia de pensamento”, que permite ao modelo resolver problemas passo a passo, identificando e corrigindo erros antes de fornecer uma resposta. Embora isso resulte em respostas mais precisas, pode levar a tempos de espera mais longos. A OpenAI afirma que o o3-mini responde 24% mais rápido que o o1-mini, sendo mais eficaz na resolução de problemas complexos, como questões de matemática em nível de doutorado.
Entretanto, a implementação desses modelos traz custos elevados. O o1-mini é 20 vezes mais caro para operar do que seu equivalente não-raciocínio, o GPT-4o mini. O novo modelo o3-mini custa 63% menos que o o1-mini por token de entrada, mas ainda assim, a um custo de $1,10 por milhão de tokens, é cerca de sete vezes mais caro que o GPT-4o mini. Essa nova versão surge após o lançamento do modelo DeepSeek, que, segundo a empresa chinesa, teve um custo de treinamento de aproximadamente $6 milhões, em comparação aos mais de $100 milhões estimados para o treinamento do GPT-4.
Além dos custos, os modelos de raciocínio apresentam novos desafios de segurança. A OpenAI utilizou uma técnica chamada alinhamento deliberativo para treinar seus modelos da série o, garantindo que eles seguissem as políticas internas em cada etapa do raciocínio. No entanto, o o3-mini, assim como o o1, demonstrou ser mais eficaz em contornar restrições de segurança, recebendo uma classificação de “risco médio” em autonomia do modelo. Isso indica um potencial maior para autoaperfeiçoamento e aceleração da pesquisa em IA, embora o modelo ainda apresente limitações em pesquisas do mundo real.
Entre na conversa da comunidade