A Mistral acaba de lançar o Large 2, um novo modelo de inteligência artificial (IA) que afirma igualar ou superar o desempenho das recentes ofertas da OpenAI e Meta, apesar de ter significativamente menos parâmetros.
PUBLICIDADE
Os detalhes
- O Large 2 possui 123 bilhões de parâmetros, menos de um terço dos 405 bilhões do Llama 3.1 da Meta, mas o supera em geração de código e matemática.
- O modelo apresenta uma janela de contexto de 128.000 tokens e suporte multilíngue aprimorado para 12 idiomas e 80 linguagens de programação.
- A Mistral afirma que o Large 2 minimiza as alucinações e produz respostas mais concisas do que os principais modelos de IA.
- O modelo está disponível para teste no Le Chat e pode ser usado nas principais plataformas em nuvem, mas requer uma licença paga para uso comercial.
Por que isso importa
Com apenas um terço do tamanho do Llama 3.1 405b e benchmarks comparáveis ao GPT-4, o Mistral Large 2 é muito impressionante. E com dois modelos abertos de nível GPT-4 lançados em apenas dois dias, a pressão acabou de subir alguns níveis para líderes de IA fechada como OpenAI, Anthropic e Google.
Leia também: