A xAI, empresa de inteligência artificial (IA) de Elon Musk, acaba de lançar o Grok 1.5 Vision, uma atualização multimodal para o modelo open-source que permite processar informações visuais.
PUBLICIDADE
🇬🇧 Subscribe to the best newsletter about AI (in English 🇬🇧) 🇧🇷 Assine a melhor newsletter sobre IA (em português 🇧🇷)
Detalhes da atualização
- O Grok 1.5V agora é capaz de processar informações visuais como documentos, gráficos, capturas de tela e fotos, com foco na compreensão do mundo real.
- A xAI criou um novo benchmark “RealWorldQA” para avaliar a compreensão espacial, e o Grok 1.5V superou os modelos GPT-4V e Gemini.
- A xAI informou que a versão 1.5V será disponibilizada para testadores e usuários existentes em breve, com melhorias significativas em imagens, áudio e vídeo esperadas para os próximos meses.
Por que isso importa
- Embora o Grok seja frequentemente subestimado nas discussões mais amplas sobre grandes modelos de linguagem (LLMs), a impressionante atualização de visão demonstra que o modelo open-source está aqui para competir.
- Com o vasto arsenal de dados da SpaceX e Tesla à sua disposição, e a determinação de Elon Musk, pode ser hora da indústria começar a prestar atenção ao Grok.
Leia também: