Apple supera o GPT-4 com o novo ReALM

Em um novo estudo, pesquisadores da Apple apresentaram o ReALM, um novo sistema de inteligência artificial capaz de entender tarefas na tela, contexto de conversas e processos em segundo plano.

Como funciona o ReALM

O ReALM usa uma nova abordagem para converter informações da tela em texto. Isso permite que ele ignore parâmetros pesados de reconhecimento de imagem, tornando a IA mais eficiente em dispositivos.
O modelo considera tanto o que está na tela do usuário quanto as tarefas ativas.
De acordo com o estudo, modelos maiores do ReALM superaram substancialmente o GPT-4, mesmo com menos parâmetros.
Imagine: você está navegando em um site e quer ligar para uma empresa. Você poderia dizer para a Siri “ligue para a empresa” e a assistente virtual seria capaz de “ver” o número de telefone na página e fazer a ligação diretamente.

Apple entra no jogo da IA com o MM1; saiba mais

A Apple mudou seu foco do projeto de carro elétrico de longo prazo para explorar a IA generativa. A empresa revelou um modelo sofisticado de IA multimodal chamado MM1, desenvolvido com a expertise de 30 pesquisadores.

Porque isso importa

O ReALM é um grande avanço para tornar os assistentes de voz mais conscientes do contexto. Ao entender as informações na tela e outros detalhes, a próxima atualização do Siri pode oferecer uma experiência de usuário mais fluida e sem precisar usar as mãos.

Leia também:

A revolução da IA deve gerar um boom no gás natural