OpenAI o1 is smarter than most humans

O último modelo da OpenAI, “o1”, supostamente marcou um QI de cerca de 120 no teste de QI da Mensa da Noruega, potencialmente marcando a primeira vez que um modelo de artificial intelligence (IA) superou o QI médio humano.

ADVERTISING

OpenAI o1 launches: First AI with reasoning capabilities

The details

o1 respondeu corretamente 25 de 35 perguntas no teste de QI da Mensa da Noruega.

Demonstrou proficiência em resolver quebra-cabeças visuais e lógicos complexos, tanto em testes publicamente disponíveis quanto em novas perguntas não publicadas.

Esse desempenho sugere que a melhoria não se deve às perguntas estarem nos dados de treinamento.

ADVERTISING

Although the OpenAI não tenha confirmado oficialmente esses resultados, membros do ChatGPT Plus podem testar o o1-preview por si mesmos usando o menu suspenso do modelo dentro do ChatGPT.

Why does it matter

Se confirmados, esses resultados indicariam that the OpenAI alcançou o desempenho da Fase 2 em seu roteiro de 5 níveis em direção à IAG. Esse marco sugere que o modelo pode parar, pensar e raciocinar sobre problemas para chegar a respostas corretas com mais frequência – um pré-requisito crucial para a Fase 3 (agentes de IA).

Read also

AI creates open-world video games from text