Inteligência Artificial

Claude ganha novas capacidades de visão de PDF

Publicado por
Isabella Caminoto

A Anthropic acabou de lançar o suporte a PDF para seu modelo Claude 3.5 Sonnet em beta público, desbloqueando a capacidade de analisar tanto texto quanto documentos visuais, como gráficos e imagens, dentro de documentos grandes.

Os detalhes

O sistema processa PDFs em três etapas: extração de texto, conversão de páginas em imagens e análise visual-textual combinada. O modelo suporta documentos de até 32 MB e 100 páginas, lidando com tudo, desde relatórios financeiros até documentos legais.

O recurso também pode ser integrado a outros recursos do Claude, como cache de prompts e processamento em lote. As capacidades de visão estão disponíveis tanto através da plataforma Claude da Anthropic quanto via acesso direto à API em aplicativos.

Por que isso importa

A capacidade do Claude de lidar com documentos grandes já era revolucionária, mas visualizar e entender imagens dentro deles leva a um nível totalmente novo. Esta atualização transforma o Claude em um analista mais completo para indústrias como saúde ou finanças, onde informações críticas são frequentemente visuais.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 11:48

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024