A OpenAI alcançou desempenho de nível ouro em uma avaliação baseada na Olimpíada Internacional de Matemática (IMO) de 2025. Para isso, testou seu “LLM experimental de raciocínio geral” com as mesmas questões usadas na competição humana.
PUBLICIDADE
Detalhes da conquista
- O LLM foi testado sob as mesmas regras dos competidores humanos, escrevendo provas em linguagem natural para problemas em duas provas de 4,5 horas, sem acesso a ferramentas ou internet.
- A OpenAI afirma que o modelo, cujo nome não foi divulgado, resolveu com sucesso 5 das 6 questões, obtendo uma pontuação de 35/42 — o suficiente para conquistar uma medalha de ouro na Olimpíada oficial.
- Cada resposta foi avaliada de forma independente por três ex-medalhistas da IMO, com as pontuações finais determinadas por consenso unânime.
- Por sua vez, o Google DeepMind refutou a alegação de medalha de ouro, afirmando que a IMO possui diretrizes internas de correção e que “nenhuma reivindicação” pode ser feita sem elas.
Por que isso importa
Críticas sobre a validade são inevitáveis, visto que conquistar o ouro na IMO tem sido um objetivo de longa data para a inteligência artificial (IA) e já foi considerado quase impossível. É interessante notar que o objetivo foi alcançado por um modelo experimental ainda não disponível publicamente, o que significa que a OpenAI certamente tem mais novidades a apresentar.
Leia também:



