A Microsoft acaba de lançar o Phi-3.5-MoE, um modelo avançado de inteligência artificial (IA) que rivaliza com as capacidades de raciocínio de modelos muito maiores, mantendo uma arquitetura compacta e eficiente.
PUBLICIDADE
Detalhes do Phi-3.5-MoE
- O Phi-3.5-MoE utiliza uma nova abordagem de mistura de especialistas (MoE), que ativa seletivamente apenas as partes mais relevantes do modelo para cada tarefa, economizando poder computacional.
- O novo modelo se destaca em compreender e seguir instruções complexas e pode lidar com até ~125.000 palavras em um único prompt.
- Em benchmarks head-to-head, o Phi-3.5-MoE superou modelos populares como o Llama 3 8B da Meta e o Gemma 2 9B do Google, mas ficou aquém do GPT-4o mini da OpenAI.
- A Microsoft disponibilizou o modelo sob uma licença MIT de código aberto no Hugging Face.
Por que isso importa
Enquanto a mídia se concentra no modelo de linguagem grande mais avançado, também há outra corrida entre gigantes da tecnologia pela IA mais inteligente, mais rápida e menor. Avanços como o Phi-3.5-MoE estão abrindo caminho para que modelos avançados de IA sejam executados diretamente e privadamente em nossos dispositivos móveis.
Leia também: