Inteligência Artificial

Apple afirma que LLMs não possuem “evidências de raciocínio formal”

Publicado por
Isabella Caminoto

Pesquisadores da Apple publicaram recentemente um novo estudo revelando limitações significativas nas capacidades de raciocínio dos LLMs, incluindo os de principais laboratórios de inteligência artificial (IA) como os modelos 4o e o1 da OpenAI.

Detalhes

Cientistas da Apple desenvolveram um novo benchmark chamado GSM-Symbolic para avaliar as habilidades de raciocínio matemático dos LLMs. O estudo descobriu que pequenas alterações na redação das perguntas ou a adição de informações irrelevantes alteraram drasticamente os resultados do modelo, com a precisão caindo em até 65%.

Os pesquisadores observaram maior variabilidade de desempenho e precisão reduzida à medida que a complexidade das perguntas aumentava. A equipe concluiu que não havia “evidências de raciocínio formal” nos modelos testados, sugerindo que o comportamento é mais provavelmente uma correspondência de padrões sofisticada.

Por que isso importa

Embora pareça haver opiniões conflitantes sobre se os LLMs podem realmente raciocinar, arquiva esta nova pesquisa na categoria ‘não’. Se essas limitações se mantiverem, elas expõem algumas questões significativas sobre a confiabilidade e os riscos de implantar modelos em aplicações cada vez mais complexas.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 14:12

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

IA da Stanford cria avatares digitais com gestos mais humanos; veja

Pesquisadores da Stanford desenvolveram um modelo de inteligência artificial (IA) que permite que avatares digitais…

2 de janeiro de 2025

DeepSeek-V3 reescreve o playbook da IA de código aberto

A startup chinesa de inteligência artificial (IA) DeepSeek acaba de lançar o DeepSeek-V3, um novo…

1 de janeiro de 2025

ChatGPT sob ataque: Vulnerabilidade expõe riscos da busca por IA

A nova funcionalidade de busca do ChatGPT, a poderosa ferramenta de inteligência artificial (IA) da…

30 de dezembro de 2024

OpenAI apresenta plano para se tornar uma empresa com fins lucrativos

A OpenAI divulgou um plano para reformular sua estrutura corporativa no próximo ano, afirmando que…

27 de dezembro de 2024

Apple se aproxima de US$ 4 trilhões de valor de mercado impulsionada pela IA

A Apple está se aproximando de uma marca histórica de US$ 4 trilhões de valor…

26 de dezembro de 2024

Gemini agora entende seus PDFs: Google integra IA ao aplicativo Arquivos

Na versão mais recente do aplicativo Arquivos do Google, invocar o Gemini enquanto olha para…

26 de dezembro de 2024