Microsoft lança novo modelo de IA que supera modelos maiores
Créditos da imagem: Curto News/Bing Image Creator

Microsoft lança novo modelo de IA que supera modelos maiores

A Microsoft acaba de lançar o Phi-3.5-MoE, um modelo avançado de inteligência artificial (IA) que rivaliza com as capacidades de raciocínio de modelos muito maiores, mantendo uma arquitetura compacta e eficiente.

PUBLICIDADE

Detalhes do Phi-3.5-MoE
  • O Phi-3.5-MoE utiliza uma nova abordagem de mistura de especialistas (MoE), que ativa seletivamente apenas as partes mais relevantes do modelo para cada tarefa, economizando poder computacional.
  • O novo modelo se destaca em compreender e seguir instruções complexas e pode lidar com até ~125.000 palavras em um único prompt.
  • Em benchmarks head-to-head, o Phi-3.5-MoE superou modelos populares como o Llama 3 8B da Meta e o Gemma 2 9B do Google, mas ficou aquém do GPT-4o mini da OpenAI.
  • A Microsoft disponibilizou o modelo sob uma licença MIT de código aberto no Hugging Face.
Por que isso importa

Enquanto a mídia se concentra no modelo de linguagem grande mais avançado, também há outra corrida entre gigantes da tecnologia pela IA mais inteligente, mais rápida e menor. Avanços como o Phi-3.5-MoE estão abrindo caminho para que modelos avançados de IA sejam executados diretamente e privadamente em nossos dispositivos móveis.

Leia também:

Rolar para cima