A Meta anunciou nesta terça-feira (22) o lançamento do SeamlessM4T, um modelo de tradução multilingue e multimodal.
Resumo:
O modelo é capaz de traduzir e transcrever fala e texto em quase 100 idiomas, incluindo idiomas com poucos recursos.
Em resumo, você grava um áudio e coloca para a ferramenta traduzir no idioma que quiser. A diferença do produto da Meta, de acordo com a empresa, é que a base de dados conta com uma gama maior de idiomas e pode traduzir simultaneamente para mais de uma opção.
O SeamlessM4T é baseado no modelo UnitY, um modelo multitarefa de tradução de fala e texto. Isso permite que o modelo aprenda as relações entre fala e texto, o que pode melhorar a precisão da tradução.
De acordo com o comunicado oficial da empresa, o modelo também é treinado em um conjunto de dados de ponta, o SpeechMatrix. Esse conjunto de dados inclui 270.000 horas de alinhamentos de fala e texto, o que fornece ao modelo um grande volume de dados para aprender.
O modelo, de acordo com a Meta, ainda pode conter várias falhas, pois ainda está em desenvolvimento. No entanto, é possível testar a plataforma através do link.
Veja também:
Este post foi modificado pela última vez em %s = human-readable time difference 21:39
O Arizona aprovou um programa escolar revolucionário, porém controverso, onde a inteligência artificial (IA) -…
Pesquisadores da Stanford desenvolveram um modelo de inteligência artificial (IA) que permite que avatares digitais…
A startup chinesa de inteligência artificial (IA) DeepSeek acaba de lançar o DeepSeek-V3, um novo…
A nova funcionalidade de busca do ChatGPT, a poderosa ferramenta de inteligência artificial (IA) da…
A OpenAI divulgou um plano para reformular sua estrutura corporativa no próximo ano, afirmando que…
A Apple está se aproximando de uma marca histórica de US$ 4 trilhões de valor…