Novo modelo da OpenAI atinge desempenho superior ao humano em testes de navegação em desktop e avança na capacidade de executar tarefas complexas por horas.
PUBLICIDADE
A OpenAI apresentou oficialmente o GPT-5.4, a mais recente evolução de sua família de modelos de inteligência artificial. O lançamento traz avanços significativos em diversas áreas — incluindo tarefas em computadores, programação, raciocínio lógico, matemática e ciência — e já está sendo apontado por executivos da empresa como o modelo mais poderoso já desenvolvido pela companhia.
Segundo Kevin Weil, vice-presidente de ciência da OpenAI, o GPT-5.4 representa “o melhor modelo que já construímos”, consolidando um salto de desempenho que pode redefinir o papel da inteligência artificial no trabalho digital.
Entre os resultados mais chamativos está o desempenho do modelo em testes que simulam tarefas reais realizadas em computadores, onde o sistema superou inclusive o desempenho médio humano.
PUBLICIDADE
IA que navega no computador melhor que pessoas
Um dos benchmarks mais relevantes apresentados pela OpenAI é o OSWorld-V, um teste criado para avaliar a capacidade de sistemas de IA de interagir com ambientes de desktop.
Esse tipo de avaliação mede se um modelo consegue:
- navegar em sistemas operacionais
- abrir e manipular aplicativos
- interpretar interfaces gráficas
- executar tarefas digitais complexas
No teste, o GPT-5.4 alcançou 75% de desempenho, superando o baseline humano de 72,4%.
Além de ultrapassar o desempenho humano médio, o resultado também representa um avanço expressivo em relação à geração anterior. O GPT-5.2 atingia aproximadamente metade desse desempenho, mostrando uma evolução significativa em poucos meses.
PUBLICIDADE
Esse progresso reforça uma tendência emergente no desenvolvimento de IA: sistemas capazes de agir diretamente em computadores, operando softwares e executando fluxos de trabalho completos.
Contexto gigante e raciocínio mais profundo
Outro avanço importante do GPT-5.4 está no aumento da capacidade de contexto, que agora pode chegar a 1 milhão de tokens.
Isso significa que o modelo consegue processar volumes enormes de informação ao mesmo tempo, como:
PUBLICIDADE
- documentos extensos
- grandes bases de código
- múltiplos arquivos e relatórios
- históricos longos de conversas
Além disso, a OpenAI introduziu um novo nível de processamento chamado “x-high reasoning effort”, que permite ao modelo dedicar mais tempo ao raciocínio antes de gerar respostas.
Na prática, essa função possibilita que agentes de IA planejem e executem tarefas complexas que podem levar horas, como projetos de programação completos, análises científicas detalhadas ou fluxos de trabalho empresariais.
Esse tipo de capacidade é considerado um passo importante para o desenvolvimento de agentes autônomos de IA, capazes de trabalhar em tarefas prolongadas sem supervisão constante.
PUBLICIDADE
Desempenho comparável ao de profissionais
Outro indicador divulgado pela OpenAI é o benchmark GDPval, que avalia desempenho em atividades de trabalho intelectual.
O teste inclui tarefas relacionadas a 44 diferentes profissões, simulando atividades comuns em áreas como pesquisa, análise, programação, escrita e estratégia.
Nos resultados apresentados, o GPT-5.4 venceu ou empatou com profissionais humanos em 83% das tarefas avaliadas.
Para comparação, o modelo anterior GPT-5.2 havia alcançado 71% no mesmo benchmark.
Esse salto de desempenho sugere que a nova geração de modelos está se aproximando rapidamente de um nível de competência que permite atuar como assistentes profissionais altamente qualificados.
Um lançamento estratégico para a OpenAI
O lançamento do GPT-5.4 ocorre poucos dias após a OpenAI ter introduzido o GPT-5.3 Instant, que se tornou o modelo padrão para conversas no ChatGPT.
Já o GPT-5.4 foi disponibilizado na versão “Thinking”, destinada aos planos Plus, Team e Pro, oferecendo maior capacidade de raciocínio para tarefas complexas.
A chegada do novo modelo também acontece em um momento estratégico para a empresa. Nas últimas semanas, a OpenAI enfrentou críticas e debates sobre o ritmo de inovação no setor de IA.
Com o GPT-5.4, a companhia busca demonstrar que a fronteira tecnológica continua avançando rapidamente.
“Não vemos um muro”
Durante o anúncio do modelo, o pesquisador da OpenAI Noam Brown fez uma declaração que chamou atenção da comunidade de tecnologia.
Segundo ele, os avanços recentes indicam que não há sinais claros de que o progresso da inteligência artificial esteja se aproximando de um limite técnico.
A frase — “We see no wall” (“Não vemos um muro”) — reflete a visão de parte da indústria de que a evolução dos modelos de IA ainda tem amplo espaço para continuar avançando.
Se essa tendência se confirmar, sistemas capazes de operar computadores, executar projetos complexos e colaborar em tarefas profissionais podem se tornar uma parte cada vez mais central do trabalho digital.
E o GPT-5.4 pode ser apenas mais um passo nessa trajetória.



