Alibaba lança novos modelos de IA que podem entender imagens

A Alibaba, uma das maiores empresas de tecnologia da China, anunciou recentemente o lançamento de dois novos modelos de IA que podem entender imagens.

Publicado por
Uesley Durães

Os modelos, chamados Qwen-VL e Qwen-VL-Chat, são modelos de linguagem de visão, o que significa que são capazes de entender imagens e gerar texto. Qwen-VL-Chat é o modelo mais avançado dos dois e é capaz de realizar tarefas complexas, como fornecer instruções, resolver equações e gerar narrativas.

Exemplo de como o modelo pode ser usado (reprodução)


“Os dois modelos podem compreender a entrada de imagens e textos em inglês e chinês. Eles podem realizar tarefas visuais, como responder perguntas abertas com base em várias imagens e gerar legendas de imagens. O Qwen-VL-Chat pode realizar tarefas mais sofisticadas, como fazer cálculos matemáticos e criar uma história baseada em múltiplas imagens”, narra o comunicado de lançamento da Alibaba.

De acordo com a Alibaba, Qwen-VL-Chat pode ser usado para:

  • Ajudar pessoas com deficiência visual a navegar pelo mundo
  • Traduzir idiomas
  • Criar conteúdo de marketing personalizado
  • Automatizar tarefas de atendimento ao cliente

O lançamento desses novos modelos é um sinal da crescente importância da IA na China. O governo chinês tem feito da IA uma prioridade e está investindo pesadamente em pesquisa e desenvolvimento. A Alibaba está tentando acompanhar o ritmo de empresas do eixo EUA-Europa.

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 12:37

Uesley Durães

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024