O Quiet-STaR treina a inteligência artificial para gerar “pensamentos” ou justificativas alternativas antes de responder às solicitações, produzindo uma combinação de previsões com e sem esses fundamentos.
PUBLICIDADE
Esse processo permite que o modelo aprenda ao descartar pensamentos irrelevantes. Quando implementado junto ao modelo de linguagem Mistral 7B, o Quiet-STaR quase dobrou sua pontuação em benchmarks de matemática e raciocínio de bom senso.
Assim como os humanos – parece que pensar antes de falar é uma boa lição para aplicar também aos modelos de inteligência artificial. Pesquisas como a Quiet-STaR mostram que dar à IA o poder de resolver desafios, considerar alternativas e aprender com os erros é um caminho forte para sistemas mais adaptáveis.
Leia também: