Imagen 3 do Google supera Midjourney e DALL-E
O Google DeepMind publicou recentemente o artigo sobre seu novo modelo de geração de imagens de inteligência artificial (IA) de última geração, Imagen 3, demonstrando que ele superou o DALL-E 3, o Midjourney v6 e o Stable Diffusion 3 em avaliações de desempenho humano.
As avaliações humanas pediram aos participantes que classificassem seus modelos preferidos quanto à qualidade geral e à adesão a instruções detalhadas.
O Imagen 3 se destacou particularmente na geração de imagens de alta qualidade e realistas que correspondem de perto a descrições de texto longas e complexas.
Apesar de sua capacidade de gerar imagens fotorrealistas com precisão, ele enfrenta dificuldades em certas tarefas que exigem raciocínio numérico, compreensão de escala e representação de ações.
O Imagen 3 está disponível para experimentar através do ImageFX e do Vertex AI.
O Google teve dificuldades em encontrar seu lugar no início da categoria de texto para imagem de IA, mas com seu último lançamento do Imagen 3, está superando as principais ferramentas do espaço. É outra vitória para o Google depois de também ter superado a OpenAI na corrida para lançamentos generalizados de IA de voz avançada ontem.
Leia também:
Este post foi modificado pela última vez em 15 de agosto de 2024 15:55
Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…
A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…
A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…
A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…
A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…
A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…