GPT-5.4 supera humanos em tarefas de computador e marca nova etapa da IA no trabalho digital

GPT-5.4 supera humanos em tarefas de computador e marca nova etapa da IA no trabalho digital

Novo modelo da OpenAI atinge desempenho superior ao humano em testes de navegação em desktop e avança na capacidade de executar tarefas complexas por horas.

PUBLICIDADE

A OpenAI apresentou oficialmente o GPT-5.4, a mais recente evolução de sua família de modelos de inteligência artificial. O lançamento traz avanços significativos em diversas áreas — incluindo tarefas em computadores, programação, raciocínio lógico, matemática e ciência — e já está sendo apontado por executivos da empresa como o modelo mais poderoso já desenvolvido pela companhia.

Segundo Kevin Weil, vice-presidente de ciência da OpenAI, o GPT-5.4 representa “o melhor modelo que já construímos”, consolidando um salto de desempenho que pode redefinir o papel da inteligência artificial no trabalho digital.

Entre os resultados mais chamativos está o desempenho do modelo em testes que simulam tarefas reais realizadas em computadores, onde o sistema superou inclusive o desempenho médio humano.

PUBLICIDADE


IA que navega no computador melhor que pessoas

Um dos benchmarks mais relevantes apresentados pela OpenAI é o OSWorld-V, um teste criado para avaliar a capacidade de sistemas de IA de interagir com ambientes de desktop.

Esse tipo de avaliação mede se um modelo consegue:

  • navegar em sistemas operacionais
  • abrir e manipular aplicativos
  • interpretar interfaces gráficas
  • executar tarefas digitais complexas

No teste, o GPT-5.4 alcançou 75% de desempenho, superando o baseline humano de 72,4%.

Além de ultrapassar o desempenho humano médio, o resultado também representa um avanço expressivo em relação à geração anterior. O GPT-5.2 atingia aproximadamente metade desse desempenho, mostrando uma evolução significativa em poucos meses.

PUBLICIDADE

Esse progresso reforça uma tendência emergente no desenvolvimento de IA: sistemas capazes de agir diretamente em computadores, operando softwares e executando fluxos de trabalho completos.


Contexto gigante e raciocínio mais profundo

Outro avanço importante do GPT-5.4 está no aumento da capacidade de contexto, que agora pode chegar a 1 milhão de tokens.

Isso significa que o modelo consegue processar volumes enormes de informação ao mesmo tempo, como:

PUBLICIDADE

  • documentos extensos
  • grandes bases de código
  • múltiplos arquivos e relatórios
  • históricos longos de conversas

Além disso, a OpenAI introduziu um novo nível de processamento chamado “x-high reasoning effort”, que permite ao modelo dedicar mais tempo ao raciocínio antes de gerar respostas.

Na prática, essa função possibilita que agentes de IA planejem e executem tarefas complexas que podem levar horas, como projetos de programação completos, análises científicas detalhadas ou fluxos de trabalho empresariais.

Esse tipo de capacidade é considerado um passo importante para o desenvolvimento de agentes autônomos de IA, capazes de trabalhar em tarefas prolongadas sem supervisão constante.

PUBLICIDADE


Desempenho comparável ao de profissionais

Outro indicador divulgado pela OpenAI é o benchmark GDPval, que avalia desempenho em atividades de trabalho intelectual.

O teste inclui tarefas relacionadas a 44 diferentes profissões, simulando atividades comuns em áreas como pesquisa, análise, programação, escrita e estratégia.

Nos resultados apresentados, o GPT-5.4 venceu ou empatou com profissionais humanos em 83% das tarefas avaliadas.

Para comparação, o modelo anterior GPT-5.2 havia alcançado 71% no mesmo benchmark.

Esse salto de desempenho sugere que a nova geração de modelos está se aproximando rapidamente de um nível de competência que permite atuar como assistentes profissionais altamente qualificados.


Um lançamento estratégico para a OpenAI

O lançamento do GPT-5.4 ocorre poucos dias após a OpenAI ter introduzido o GPT-5.3 Instant, que se tornou o modelo padrão para conversas no ChatGPT.

Já o GPT-5.4 foi disponibilizado na versão “Thinking”, destinada aos planos Plus, Team e Pro, oferecendo maior capacidade de raciocínio para tarefas complexas.

A chegada do novo modelo também acontece em um momento estratégico para a empresa. Nas últimas semanas, a OpenAI enfrentou críticas e debates sobre o ritmo de inovação no setor de IA.

Com o GPT-5.4, a companhia busca demonstrar que a fronteira tecnológica continua avançando rapidamente.


“Não vemos um muro”

Durante o anúncio do modelo, o pesquisador da OpenAI Noam Brown fez uma declaração que chamou atenção da comunidade de tecnologia.

Segundo ele, os avanços recentes indicam que não há sinais claros de que o progresso da inteligência artificial esteja se aproximando de um limite técnico.

A frase — “We see no wall” (“Não vemos um muro”) — reflete a visão de parte da indústria de que a evolução dos modelos de IA ainda tem amplo espaço para continuar avançando.

Se essa tendência se confirmar, sistemas capazes de operar computadores, executar projetos complexos e colaborar em tarefas profissionais podem se tornar uma parte cada vez mais central do trabalho digital.

E o GPT-5.4 pode ser apenas mais um passo nessa trajetória.

Rolar para cima