Sakana desenvolve novos modelos de IA

A Sakana AI utilizou uma abordagem de “fusão de modelos”, combinada com um algoritmo evolutivo, para desenvolver seus novos modelos. Esse processo envolveu a geração de centenas de modelos, onde os mais eficazes serviram como base para as próximas iterações.

Ex-pesquisadores do Google lançam startup de IA no Japão; saiba mais sobre a Sakana AI

Dois ex-pesquisadores do Google Brain, Llion Jones e David Ha, lançaram uma startup de IA com sede em Tóquio, no Japão. A empresa, chamada Sakana AI, tem como objetivo desenvolver um modelo de IA generativo nativo, capaz de produzir diversas formas de conteúdo, como texto, imagens, código e elementos multimídia.

A empresa está disponibilizando o código-fonte de dois dos modelos desenvolvidos. Notavelmente, o modelo de parâmetro 7B LLM-JP demonstrou superar os modelos de parâmetro 70B em vários benchmarks.

Os três lançamentos de modelo incluem:

EvoLLM-JP: Um modelo de idioma com forte fluência em japonês e capacidades matemáticas
EvoSDXL-JP: Um modelo de difusão para geração de imagens em alta velocidade
EvoVLM-JP: Um modelo de linguagem de visão para textos e imagens em japonês

O forte desempenho de Sakana pode sugerir um novo caminho alternativo de treinamento para modelos de inteligência artificial.

Se for escalável, também poderá democratizar significativamente o desenvolvimento da tecnologia – permitindo que modelos de alta qualidade e específicos para tarefas evoluam rapidamente, misturando e combinando o universo em expansão da IA de código aberto.

Leia também:

Paciente da Neuralink joga xadrez com a mente; veja