OpenAI testa IA contra trabalhadores humanos em 44 profissões; confira
A OpenAI apresentou o GDPval, um novo benchmark criado para medir se modelos de inteligência artificial (IA) conseguem alcançar a qualidade de trabalho de profissionais humanos em 44 ocupações diferentes. O teste avaliou alguns dos modelos mais avançados do mercado, como GPT-5, Claude Opus 4.1, Gemini 2.5 e Grok 4, comparando seu desempenho ao de especialistas da indústria.
Apesar das manchetes alarmistas sobre substituição imediata da força de trabalho, o GDPval demonstra que, mesmo os modelos mais avançados, estão apenas começando a atingir paridade com profissionais humanos em determinadas tarefas. Mas, se este benchmark seguir a tendência de outros no campo da IA, é apenas questão de alguns meses para que modelos mais sofisticados deem um salto significativo em direção a superar o desempenho humano.
Leia também:
Este post foi modificado pela última vez em 26 de setembro de 2025 14:38
Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…
A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…
A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…
A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…
A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…
A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…