Jais foi treinado em um conjunto de dados de 395 bilhões de tokens árabes e ingleses. O conjunto de dados foi cuidadosamente selecionado para capturar a diversidade e a riqueza da língua árabe, afirma o comunicado de lançamento oficial.
PUBLICIDADE
A IA é superior aos modelos árabes existentes por uma margem considerável. Também é competitivo com modelos ingleses de tamanho semelhante, apesar de ser treinado com menos dados em inglês. Isso mostra que o componente inglês do modelo aprendeu com os dados árabes e vice-versa.
Jais é o modelo mais eficiente para falantes de árabe
O lançamento de Jais é um marco significativo para o mundo árabe. Ele oferece a mais de 400 milhões de falantes de árabe a oportunidade de aproveitar o potencial da IA generativa.
O código-fonte de Jais está disponível para download no Hugging Face. Os usuários também podem experimentar Jais online, registrando interesse no site da ferramenta.
PUBLICIDADE
Veja também: