Sakana AI desenvolve novos modelos de IA

A startup Sakana AI, com sede em Tóquio, acaba de lançar três novos modelos de IA em língua japonesa, criados através da “criação” de modelos de código aberto existentes para produzir “descendentes” otimizados.

Publicado por

Juliana Caminoto

22 de março de 2024 14:00

Sakana AI

A Sakana AI utilizou uma abordagem de “fusão de modelos”, combinada com um algoritmo evolutivo, para desenvolver seus novos modelos. Esse processo envolveu a geração de centenas de modelos, onde os mais eficazes serviram como base para as próximas iterações.

Ex-pesquisadores do Google lançam startup de IA no Japão; saiba mais sobre a Sakana AI

Dois ex-pesquisadores do Google Brain, Llion Jones e David Ha, lançaram uma startup de IA com sede em Tóquio, no Japão. A empresa, chamada Sakana AI, tem como objetivo desenvolver um modelo de IA generativo nativo, capaz de produzir diversas formas de conteúdo, como texto, imagens, código e elementos multimídia.

A empresa está disponibilizando o código-fonte de dois dos modelos desenvolvidos. Notavelmente, o modelo de parâmetro 7B LLM-JP demonstrou superar os modelos de parâmetro 70B em vários benchmarks.

Os três lançamentos de modelo incluem:

EvoLLM-JP: Um modelo de idioma com forte fluência em japonês e capacidades matemáticas
EvoSDXL-JP: Um modelo de difusão para geração de imagens em alta velocidade
EvoVLM-JP: Um modelo de linguagem de visão para textos e imagens em japonês

O forte desempenho de Sakana pode sugerir um novo caminho alternativo de treinamento para modelos de inteligência artificial.

Se for escalável, também poderá democratizar significativamente o desenvolvimento da tecnologia – permitindo que modelos de alta qualidade e específicos para tarefas evoluam rapidamente, misturando e combinando o universo em expansão da IA de código aberto.

Leia também:

Paciente da Neuralink joga xadrez com a mente; veja

A Neuralink acaba de transmitir ao vivo seu primeiro paciente que recebeu um implante de chip cerebral jogando xadrez online e outros jogos apenas com controle mental – em um marco importante para a tecnologia.

Este post foi modificado pela última vez em %s = human-readable time difference 13:45

Juliana Caminoto

Advogada com especialização em compliance e auditoria, estou sempre conectada às redes sociais e em busca de novos desafios. Sou mãe de pet e amo viajar.