A OpenAI acaba de introduzir o MLE-bench, um novo benchmark projetado para avaliar o desempenho de agentes de inteligência artificial (IA) em tarefas de engenharia de machine learning no mundo real, utilizando competições do Kaggle.
Os agentes de IA estão ganhando força — e novos benchmarks são necessários para avaliar suas capacidades que superam as medidas de teste anteriores. Com os comentários da OpenAI, uma onda de startups impulsionando capacidades de agentes, e a criação de novos benchmarks, a revolução dos agentes de IA parece prestes a explodir.
Leia também:
Este post foi modificado pela última vez em 11 de outubro de 2024 14:36
Esforços para influenciar as políticas do presidente eleito Donald Trump por meio de Elon Musk…
Empresas de inteligência artificial (IA) como a OpenAI estão buscando superar atrasos inesperados e desafios…
Pesquisadores do MIT divulgaram um sistema de inteligência artificial (IA) chamado LucidSim que treina robôs…
Sam Altman, CEO da OpenAI, acabou de prever que a inteligência artificial geral (AGI) será…
Os Beatles foram indicados a dois Grammys - quase 50 anos após a banda se…
A ByteDance acaba de revelar o X-Portrait 2, um sistema de inteligência artificial (IA) que…