[gtranslate]

Inteligência Artificial

Nova IA bate recorde em benchmark de codificação

Publicado por
Isabella Caminoto

A Cosine acaba de apresentar o Genie, seu novo engenheiro de software de inteligência artificial (IA) totalmente autônomo que quebrou o recorde de pontuação em um benchmark para avaliar as habilidades de codificação de grandes modelos de linguagem (LLMs), em mais de 10%.

Os detalhes

  • A Cosine treinou o Genie em um conjunto de dados que emula como os engenheiros de software humanos realmente trabalham, desde a descoberta incremental de conhecimento até a tomada de decisões passo a passo.
  • Quando comete um erro, o Genie itera, replana e reexecuta até corrigir o problema, algo com o qual os modelos fundamentais lutam.
  • O Genie obteve uma pontuação de 30,08% no SWE-Bench, uma melhoria de 57% em relação aos melhores desempenhos anteriores, como o Q e o Code Factory da Amazon, com 19% (o GPT-4 obteve 1,31%).
  • A lista de espera está atualmente aberta, mas o Genie ainda não foi lançado para o público em geral.

Por que isso importa

A Cosine está repensando completamente a maneira como a IA é treinada, ensinando-a a ser mais humana durante seu treinamento, em vez de se concentrar no design de prompts pós-treinamento – e funciona! Com seu recente sucesso no SWE-Bench, mais empresas provavelmente adotarão o processo e construirão IAs mais inteligentes, uma vitória para todos.

Leia também:

Este post foi modificado pela última vez em 13 de agosto de 2024 13:47

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Trump assina ordem executiva para revisar IA antes do lançamento e reacende debate sobre regulação nos EUA

O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…

3 de junho de 2026

IA na saúde mental herda preconceitos humanos — e pesquisadores alertam para riscos invisíveis

A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…

28 de maio de 2026

Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação

A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…

27 de maio de 2026

Papa Leão XIV lança manifesto histórico sobre IA e alerta: “Nenhum algoritmo pode substituir a humanidade”

A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…

26 de maio de 2026

Google resolve nove problemas matemáticos inéditos com IA e acelera corrida por descobertas científicas

A disputa entre gigantes da inteligência artificial (IA) acaba de atingir um novo patamar —…

25 de maio de 2026

IA no seu pulso: wearables querem prever doenças antes mesmo dos sintomas

Relógios inteligentes, anéis biométricos e pulseiras fitness estão entrando em uma nova fase: deixar de…

21 de maio de 2026