Inteligência Artificial

Sakana AI desenvolve novos modelos de IA

A startup Sakana AI, com sede em Tóquio, acaba de lançar três novos modelos de IA em língua japonesa, criados através da “criação” de modelos de código aberto existentes para produzir “descendentes” otimizados.

Publicado por
Juliana Caminoto

A Sakana AI utilizou uma abordagem de “fusão de modelos”, combinada com um algoritmo evolutivo, para desenvolver seus novos modelos. Esse processo envolveu a geração de centenas de modelos, onde os mais eficazes serviram como base para as próximas iterações.

A empresa está disponibilizando o código-fonte de dois dos modelos desenvolvidos. Notavelmente, o modelo de parâmetro 7B LLM-JP demonstrou superar os modelos de parâmetro 70B em vários benchmarks.

Os três lançamentos de modelo incluem:

  • EvoLLM-JP: Um modelo de idioma com forte fluência em japonês e capacidades matemáticas
  • EvoSDXL-JP: Um modelo de difusão para geração de imagens em alta velocidade
  • EvoVLM-JP: Um modelo de linguagem de visão para textos e imagens em japonês

O forte desempenho de Sakana pode sugerir um novo caminho alternativo de treinamento para modelos de inteligência artificial.

Se for escalável, também poderá democratizar significativamente o desenvolvimento da tecnologia ​​– permitindo que modelos de alta qualidade e específicos para tarefas evoluam rapidamente, misturando e combinando o universo em expansão da IA ​​de código aberto.

Leia também:

Este post foi modificado pela última vez em 22 de março de 2024 13:45

Juliana Caminoto

Advogada com especialização em compliance e auditoria, estou sempre conectada às redes sociais e em busca de novos desafios. Sou mãe de pet e amo viajar.

Posts recentes

Prime Video lança recurso de resumo automático com IA

A Amazon Prime Video está recebendo um novo recurso alimentado por IA generativa para ajudá-lo…

4 de novembro de 2024

Election Information Hub: Perplexity lança central de informações eleitorais com IA

A empresa de busca com inteligência artificial (IA) Perplexity está testando a ideia de usar…

4 de novembro de 2024

ADNOC dos Emirados Árabes Unidos irá implantar IA autônoma no setor de energia; veja

A gigante de energia dos Emirados Árabes Unidos, ADNOC, aplicará inteligência artificial (IA) altamente autônoma…

4 de novembro de 2024

Claude ganha novas capacidades de visão de PDF

A Anthropic acabou de lançar o suporte a PDF para seu modelo Claude 3.5 Sonnet…

4 de novembro de 2024

Google integra controles para casa inteligente no Gemini

O Google está adicionando uma extensão do Google Home ao aplicativo Gemini, permitindo que você…

3 de novembro de 2024

Walt Disney forma unidade de negócios para coordenar o uso de IA e realidade aumentada

A Walt Disney está formando um novo grupo para coordenar o uso da empresa de…

1 de novembro de 2024