A OpenAI lançou o o3 e o4-mini, seus modelos de raciocínio mais inteligentes até o momento, agora equipados com acesso agentivo completo a todas as ferramentas do ChatGPT e a capacidade de “pensar com imagens” – juntamente com o lançamento de um novo agente de codificação de código aberto.
PUBLICIDADE
Detalhes do o3 e o4-mini
- O OpenAI o3 é o novo modelo de raciocínio de ponta, impulsionando o desempenho SOTA (state-of-the-art) em benchmarks de codificação, matemática, ciência e multimodalidade.
- O o4-mini oferece raciocínio rápido e econômico, superando significativamente modelos mini anteriores e até mesmo saturando benchmarks como o AIME 2025 de matemática.
- Ambos os modelos podem usar e combinar todas as ferramentas dentro do ChatGPT (busca na web, Python, geração de imagens, etc.) como parte de seu processo de resolução de problemas.
- Os modelos também são os primeiros a serem capazes de “pensar com imagens”, integrando análise e manipulação visual diretamente em sua cadeia de pensamento.
- Também está sendo lançado o Codex CLI, um agente de codificação de código aberto que roda nos terminais dos usuários e conecta modelos de raciocínio com tarefas de codificação.
- O presidente Greg Brockman afirmou que o lançamento é um “passo qualitativo de nível GPT-4 para o futuro”, com os modelos capazes de produzir novas ideias científicas.
Por que isso é importante
Seja qual for o patamar para a AGI (Inteligência Artificial Geral), parece que os mais recentes modelos SOTA estão se aproximando. Embora os modelos de raciocínio já fossem um grande salto, equipá-los com acesso a ferramentas e capacidades multimodais levou a uma classe de modelos que está criando novas ideias – aparentemente nos levando ao Passo 4 da escada de inteligência artificial da OpenAI.
Leia também: