GPT-4 mostra diminuição na precisão em tarefa de matemática, aponta estudo de Stanford

Um estudo da Universidade de Stanford descobriu que o GPT-4, da OpenAI, mostra resultados mistos em uma variedade de tarefas. O estudo, que foi publicado na revista Nature, descobriu que o GPT-4 se saiu melhor do que o ChatGPT, outro modelo de linguagem grande, em tarefas de matemática, programação e raciocínio visual. No entanto, o GPT-4 também mostrou uma diminuição na precisão em uma tarefa de matemática, o que pode ser atribuível a mudanças no comportamento do modelo em vez de um declínio na qualidade.

Publicado por
Uesley Durães

Os pesquisadores do estudo disseram que o GPT-4 é um modelo de linguagem poderoso que pode ser usado para uma variedade de tarefas. No entanto, eles também disseram que é importante estar ciente de suas limitações e incorporá-lo em práticas de teste adequadas.

O estudo de Stanford, intitulado “Como o comportamento do ChatGPT está mudando com o tempo?”, é o mais recente de uma série de estudos que avaliam o desempenho dos modelos de linguagem grandes. Esses estudos mostraram que os modelos de linguagem grandes podem ser usados para uma variedade de tarefas, mas também mostraram que eles têm limitações. É importante estar ciente dessas limitações ao usar modelos de linguagem grandes.

O estudo da Universidade de Stanford completo pode ser conferido neste link

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 12:38

Uesley Durães

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024