Inteligência Artificial

Microsoft lança Phi-4, um modelo de linguagem pequeno e poderoso

Publicado por
Isabella Caminoto

A Microsoft acaba de lançar o Phi-4, um modelo de linguagem de 14B parâmetros que supera concorrentes massivos como o GPT-4o e o Gemini Pro 1.5 em áreas como raciocínio matemático, apesar de uma diferença de tamanho drástica.

Detalhes do lançamento
  • O Phi-4 supera modelos como o Gemini Pro 1.5 em vários benchmarks de matemática e raciocínio complexo, apesar de ser uma fração do tamanho.
  • O Phi-4 até mesmo supera seu modelo professor, o GPT-4o, em problemas de Q&A de nível de pós-graduação em STEM e problemas de competição matemática.
  • A Microsoft treinou o Phi-4 principalmente em dados sintéticos, usando IA para gerar e validar aproximadamente 400 bilhões de tokens de material de treinamento de alta qualidade.
  • O modelo também apresenta um mecanismo atualizado que pode processar entradas mais longas de até 4.000 tokens, o dobro da capacidade do Phi-3.
  • O Phi-4 está disponível em uma prévia de pesquisa limitada no Azure AI Foundry, e um lançamento mais amplo está planejado para o Hugging Face.
Por que isso importa

Os modelos Phi da Microsoft continuam a desafiar a tendência de “maior é melhor” na IA, mostrando que modelos menores podem igualar ou exceder as capacidades dos maiores – particularmente em áreas especializadas.

O futuro da inteligência artificial (IA) pode não ser sobre tamanho bruto, mas sobre arquiteturas e abordagens de treinamento mais inteligentes que fazem mais com menos.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 11:55

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Compartilhar
Publicado por
Isabella Caminoto

Posts recentes

Transição da OpenAI para o lucro é questionada pela Meta; entenda

A Meta está pedindo ao Procurador-Geral da Califórnia, Rob Bonta, que bloqueie a transição planejada…

15 de dezembro de 2024

Anthropic analisa o uso de IA no mundo real com Clio

A Anthropic introduziu o Clio, um novo sistema que revela padrões em como as pessoas…

15 de dezembro de 2024

Anthropic disponibiliza o Claude 3.5 Haiku para todos os usuários

A Anthropic lançou silenciosamente seu modelo de inteligência artificial (IA) mais rápido, o Claude 3.5…

13 de dezembro de 2024

ChatGPT avançado ganha capacidades de visão; veja

A OpenAI acabou de lançar uma atualização importante para o Modo de Voz Avançado do…

13 de dezembro de 2024

Google Gemini agora pode resumir o conteúdo das suas pastas no Google Drive

O Gemini, do Google, está ficando ainda mais útil, agora integrado ao Google Drive. Além…

12 de dezembro de 2024

Apple Intelligence recebe grande atualização com iOS 18.2

A Apple acabou de lançar sua maior atualização da Apple Intelligence até agora, criação de…

12 de dezembro de 2024