Pesquisadores do MIT acabam de desenvolver o Self-Adapting LLMs (SEAL), uma estrutura que permite que grandes modelos de linguagem (LLMs) ensinem e aprimorem-se por conta própria, criando seus próprios dados de treinamento e instruções para autoatualizações.
PUBLICIDADE
Detalhes do SEAL
- O SEAL permite que os modelos gerem suas próprias “autoedições” — instruções para criar dados sintéticos e definir parâmetros para atualizar seus próprios pesos.
- Ele aprende por tentativa e erro através de um ciclo de aprendizado por reforço, recompensando o modelo por gerar autoedições que levam a um melhor desempenho.
- Em tarefas de conhecimento, a IA aprendeu de forma mais eficaz com suas próprias anotações do que com materiais de aprendizado gerados pelo GPT-4.1, que é muito maior.
- O sistema também melhorou drasticamente em tarefas de resolução de quebra-cabeças, saltando de 0% com métodos padrão para 72,5% após aprender a treinar-se de forma eficaz.
Por que isso importa
A inteligência artificial (IA) que se autoaperfeiçoa é frequentemente mencionada como um potencial prelúdio para o salto em direção à superinteligência. Embora o SEAL (e outras estruturas de pesquisa como o DGM da Sakana) ainda não estejam nesse nível, eles apontam para um futuro assustador, mas emocionante, onde os modelos podem continuar a se aprimorar (exponencialmente) por conta própria, indo além do design humano.
Leia também:



