Inteligência Artificial

Laboratório de IA de Xangai cria LLM que rivaliza GPT-4 em matemática

Publicado por
Isabella Caminoto

Pesquisadores do Laboratório de IA de Xangai desenvolveram recentemente um novo algoritmo chamado MCT Self-Refine, que permitiu a um modelo relativamente pequeno, com 8 bilhões de parâmetros, alcançar o desempenho do GPT-4 em matemática complexa.

Como funciona

O MCT Self-Refine combina um modelo LLaMa de 8 bilhões de parâmetros com a Busca por Árvore de Monte Carlo, uma técnica de inteligência artificial (IA) famosa por ter sido usada pelo DeepMind do Google para dominar o jogo de Go.

O algoritmo constrói uma árvore de busca, refinando as respostas por meio de uma série de processos e autoavaliação.

No benchmark de problemas matemáticos verbais GSM-Hard, a adição da Busca por Árvore de Monte Carlo elevou a precisão do modelo de 8 bilhões de parâmetros de 25,5% para 45,5%.

O modelo também alcançou 96,7% no benchmark GSM8K, superando modelos significativamente maiores como GPT-4, Claude e Gemini.

Por que isso importa

A pesquisa demonstra que é possível impulsionar as capacidades matemáticas sem a necessidade de uma escala massiva. Alcançar o desempenho do GPT-4 com um modelo treinado em 200 vezes menos parâmetros é um feito impressionante. Se a abordagem se provar um caminho mais eficiente para o raciocínio avançado, poderemos estar à beira de uma nova onda de aceleração de modelos.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 13:07

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024