A Alibaba acaba de apresentar o Qwen2-VL, um novo modelo de inteligência artificial (IA) de linguagem e visão que supera o GPT-4o em vários benchmarks, especialmente se destacando na compreensão de documentos e na compreensão multilíngue de texto e imagem.
PUBLICIDADE
Saiba mais sobre o Qwen2
- O Qwen2-VL pode entender imagens de várias resoluções e proporções, bem como vídeos com mais de 20 minutos de duração.
- O modelo se destaca especialmente em tarefas complexas como resolução de problemas de nível universitário, raciocínio matemático e análise de documentos.
- Ele também suporta compreensão de texto multilíngue em imagens, incluindo a maioria dos idiomas europeus, japonês, coreano, árabe e vietnamita.
- Você pode experimentar o Qwen2-VL no Hugging Face, com mais informações no blog oficial do anúncio.
Por que isso importa
Há mais um novo concorrente na arena dos modelos de IA de última geração, e vem da Alibaba da China. A capacidade do Qwen2-VL de entender entradas visuais diversas e solicitações multilíngues pode levar a aplicativos de IA mais sofisticados e acessíveis globalmente.
Leia também: