Os modelos, chamados Qwen-VL e Qwen-VL-Chat, são modelos de linguagem de visão, o que significa que são capazes de entender imagens e gerar texto. Qwen-VL-Chat é o modelo mais avançado dos dois e é capaz de realizar tarefas complexas, como fornecer instruções, resolver equações e gerar narrativas.
PUBLICIDADE
“Os dois modelos podem compreender a entrada de imagens e textos em inglês e chinês. Eles podem realizar tarefas visuais, como responder perguntas abertas com base em várias imagens e gerar legendas de imagens. O Qwen-VL-Chat pode realizar tarefas mais sofisticadas, como fazer cálculos matemáticos e criar uma história baseada em múltiplas imagens”, narra o comunicado de lançamento da Alibaba.
De acordo com a Alibaba, Qwen-VL-Chat pode ser usado para:
- Ajudar pessoas com deficiência visual a navegar pelo mundo
- Traduzir idiomas
- Criar conteúdo de marketing personalizado
- Automatizar tarefas de atendimento ao cliente
O lançamento desses novos modelos é um sinal da crescente importância da IA na China. O governo chinês tem feito da IA uma prioridade e está investindo pesadamente em pesquisa e desenvolvimento. A Alibaba está tentando acompanhar o ritmo de empresas do eixo EUA-Europa.
Veja também: