A startup Sakana AI, com sede em Tóquio, acaba de lançar três novos modelos de IA em língua japonesa, criados através da “criação” de modelos de código aberto existentes para produzir “descendentes” otimizados.
Sakana AI
A Sakana AI utilizou uma abordagem de “fusão de modelos”, combinada com um algoritmo evolutivo, para desenvolver seus novos modelos. Esse processo envolveu a geração de centenas de modelos, onde os mais eficazes serviram como base para as próximas iterações.
A empresa está disponibilizando o código-fonte de dois dos modelos desenvolvidos. Notavelmente, o modelo de parâmetro 7B LLM-JP demonstrou superar os modelos de parâmetro 70B em vários benchmarks.
Os três lançamentos de modelo incluem:
O forte desempenho de Sakana pode sugerir um novo caminho alternativo de treinamento para modelos de inteligência artificial.
Se for escalável, também poderá democratizar significativamente o desenvolvimento da tecnologia – permitindo que modelos de alta qualidade e específicos para tarefas evoluam rapidamente, misturando e combinando o universo em expansão da IA de código aberto.
Leia também:
Este post foi modificado pela última vez em 22 de março de 2024 13:45
Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…
A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…
A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…
A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…
A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…
A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…