O último modelo da OpenAI, “o1”, supostamente marcou um QI de cerca de 120 no teste de QI da Mensa da Noruega, potencialmente marcando a primeira vez que um modelo de inteligência artificial (IA) superou o QI médio humano.
o1 respondeu corretamente 25 de 35 perguntas no teste de QI da Mensa da Noruega.
Demonstrou proficiência em resolver quebra-cabeças visuais e lógicos complexos, tanto em testes publicamente disponíveis quanto em novas perguntas não publicadas.
Esse desempenho sugere que a melhoria não se deve às perguntas estarem nos dados de treinamento.
Embora a OpenAI não tenha confirmado oficialmente esses resultados, membros do ChatGPT Plus podem testar o o1-preview por si mesmos usando o menu suspenso do modelo dentro do ChatGPT.
Se confirmados, esses resultados indicariam que a OpenAI alcançou o desempenho da Fase 2 em seu roteiro de 5 níveis em direção à IAG. Esse marco sugere que o modelo pode parar, pensar e raciocinar sobre problemas para chegar a respostas corretas com mais frequência – um pré-requisito crucial para a Fase 3 (agentes de IA).
Leia também:
Este post foi modificado pela última vez em 16 de setembro de 2024 13:15
A startup de inteligência artificial (IA) Runway fez um nome para si mesma construindo modelos…
Golpistas estão usando a inteligência artificial (IA) para transformar seus vídeos de redes sociais em…
A 1X desenvolveu seu ‘World Model’, um simulador virtual alimentado por inteligência artificial (IA) para…
A Snap acaba de apresentar seus Spectacles de quinta geração, óculos AR autônomos alimentados pelo…
Um em cada cinco médicos de família (GPs) no Reino Unido está usando ferramentas de…
O governo Biden anunciou na quarta-feira (18) que realizará uma Cúpula Global de Segurança sobre…