Meta apresenta SeamlessM4T, seu modelo de tradução multilíngue

A Meta anunciou nesta terça-feira (22) o lançamento do SeamlessM4T, um modelo de tradução multilingue e multimodal.

Publicado por
Uesley Durães

Resumo:

  • A Meta lançou hoje o SeamlessM4T, um modelo de tradução multilíngue e multimodal que pode traduzir e transcrever fala e texto em quase 100 idiomas, incluindo idiomas com poucos recursos.
  • O modelo é baseado no modelo UnitY, um modelo multitarefa de tradução de fala e texto.
  • O anúncio do SeamlessM4T é um avanço significativo na tecnologia de tradução.

O modelo é capaz de traduzir e transcrever fala e texto em quase 100 idiomas, incluindo idiomas com poucos recursos.

Em resumo, você grava um áudio e coloca para a ferramenta traduzir no idioma que quiser. A diferença do produto da Meta, de acordo com a empresa, é que a base de dados conta com uma gama maior de idiomas e pode traduzir simultaneamente para mais de uma opção. 

O SeamlessM4T é baseado no modelo UnitY, um modelo multitarefa de tradução de fala e texto. Isso permite que o modelo aprenda as relações entre fala e texto, o que pode melhorar a precisão da tradução.

O modelo já está disponível para teste (print)

De acordo com o comunicado oficial da empresa, o modelo também é treinado em um conjunto de dados de ponta, o SpeechMatrix. Esse conjunto de dados inclui 270.000 horas de alinhamentos de fala e texto, o que fornece ao modelo um grande volume de dados para aprender.

O modelo, de acordo com a Meta, ainda pode conter várias falhas, pois ainda está em desenvolvimento. No entanto, é possível testar a plataforma através do link. 

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 21:39

Uesley Durães

Posts recentes

Black Forest Labs lança suíte de edição de imagens com IA

A BlackForestLabs acaba de revelar o FLUX.1 Tools, quatro novos recursos de manipulação de imagens…

24 de novembro de 2024

Gemini recupera o primeiro lugar no ranking de LLM

O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…

22 de novembro de 2024

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024